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(54) Bezeichnung: REKOMBINANTE CHLADOSPORIUM HERB ARUM ALLERGENE 

(57) Abstract 

The invention relates to recombinant DNA molecules that code for polypeptides that have the antigenicity of the allergens Clah53, 
Clah47, ClaWr? and Clahll or for peptides that have at least one epitope of these allergens. These molecules are characterized in that they 
have nucleic acid sequences that homologously match the sequences, 1, 3-5, 7-9, 12-14 as well as 16 and 17, or with segments of these 
sequences, or have nucleic acid sequences that hybridize with the indicated nucleic acid sequences under stringent conditions. 

(57) Zusammenfassung 

Die Erfindung bezieht sich auf rekombinante DNA MolekOle, die fur Polypeptide kodieren, die die Antigemtat der Allefgene Clah53, 
Clah47, Clah22 und Clahll besitzen oder fur Peptide, die mindestens ein Epitop dieser AUergene aufweisen. Diese MolekOle sind dadurch 
gekennzeichnet, daB sie NukleinsSuresequenzen aufweisen, die mit den Sequenzen 1, 3-5, 7-9, 12-14 sowie 16 und 17, oder mit Teilbereichen 
dieser Sequenzen in homologer Weise Qbereinsonimen, bzw. Nucleinsauresequenzen, die mit den gennanten Nucleinsauresequenzen unter 
stringenten Bedingungen hybridisieren. 
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Rekombinante Chladosporium herbarum Allergene 

Die Erfindung bezieht sich auf rekombinante DNA-Molekiile, die fur 
Polypeptide kodieren, die die Antigenitat der Allergene Clah 53, Clah47, Clah22 
und Clah 11 besitzen oder fur Peptide, die mindestens ein Epitop dieser Allergene 
^ aufweisen. 

Die genannten Allergene des extramuralen Schimmelpilzes Cladosporium 
herbarum, sowie auf die Molekulfragmente ( B- und T-Zell stimulierende Peptide) 
fuhren im Rahmen einer Immunantwort zu einem Uberschieflen der IgE 
Antikorperproduktion bei Pilzallergikern. Rekombinante Allergene bzw. immunogen 
wirkebde Teilpeptide konnen sowohl in vitro als auch in vivo zu einer verbesserten 

^ Diagnostik von Schimmelpilzallergien aber auch zur Induktion einer Immuntoleranz 
bzw. Anergie von allergenspezifischen T-Zellen herangezogen werden. 

Das Immunsystem der Vertebraten entwickeite sich in der Evolution ais 
wirksame Waffe gegen Angriffe auf das Individuum von auflen, aber auch von 
innen. Unter "normalen" Bedingungen kann das Immunsystem zwischen "Selbst" 
und "Nicht-Selbst" unterscheiden. Wie man aber heute von vielen 

15 Regulationskaskaden weifi, laufen solche Regulationsmechanismen nicht immer 
fehlerlos ab, was im Falle der Immunologie einem Angriff auf eigenes Gewebe 
gleichkommt. Man kennt heute mehrere prinzipielle Situationen, in denen der Koiper 
Opfer seines eigenen Immunsystems wird. Eine dieser unerwunschten 
immunologischen Antworten kann durch Umweltantigene ausgelost werden. Die 
Reaktion, die durch diese Fehlsteuerung verursacht wird, nennt man Allergie oder 

20 

v Hypersensibilitats-Reaktion. Gell und Coombs (1975) defmierten 4 
Hypersensibilitatstypen (Typ I,II,m und IV). Allergene wie Pilzsporen gehoren zu 
den w Typ I" oder "Anaphylaxie^)^^^^!!^" auslosenden Antigenen. 

Das typische Bild einer Typ I Hypersensibilitat besteht darin, daB ein 
einmaliger Kontakt mit einem bestimmten Antigen (z.B. mit Pilzsporen) keinen 
nennenswerten Effekt auf das Individuum zeigt. Kommt es jedoch nach einigen 
^ Wochen ein zweites Mai zu einem Allergenkontakt, dann reagiert der nun 
sensibilisierte Organismus mit Symptomen einer allgemeinen Anaphylaxie. Eine 
Kontraktion der glatten Muskulatur sowie eine Dilatation der Kapillaren ist die 
Folge. Dies beruht darauf, dafi der primare Kontakt mit dem allergenen Proteine in 
einer ungewohnlichen humoralen Immupantwort resultiert. Neben einer in diesem 
Fall erwunschten IgG-Antwort, antwortet der Allergiepatient mit einer massiven 

30 

IgE-Produktion. Diese primar gebildeten IgEs, binden mit ihren Fc-Teilen an 
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spezifische hochaffine Fc-Epsilon-Rezeptoren, deren Hauptiokalisation an der 
AuBenseite von Mastzellen und Basophilen zu finden ist. Bei einem Zweitkontakt mit 
dem Allergen kommt es zwischen den gebundenen IgE-Molekulen durch das 
Allergen zu einer Quervernetzung, was schlieBlich eine Degranulation der Mastzellen 
und Basophilen und somit die Freisetzung von Mediatorstoffen wie Histamin und 
5 Arachidonsauremetaboliten etc. zur Folge hat. 

Die wichtigsten Umweltallergene sind Proteine mit einem Molekulargewichte 
zwischen 10 und 50kD. Die wichtigste Quelle dieser allergenen Proteine, die eine 
TypI-AUergie hervorrufen, stellen Inhalationsallergene wie Pilzsporen, Pollen, Kot 
von Hausstaubmilben etc. dar (Review Bold et al. 1973). Die fur eine Pilzallergie 
relevanten Pilze gehoren einer Gruppe von eukaryontischen, filamentos wachsenden, 
10 Sporen bildenden Pilzen an. Da die Sporen die Verbreitungsform des Pilzes 
darstellen (die Sporen konnen durch den Wind leicht vertragen werden), ist 
anzunehmen, daB ihnen eine entscheidende Rolle bei der Allergieauslosung 
zukommt. 

Man weiB heute, daB 20% der Atopiker durch Pilzsporen sensibilisiert 
wurden (Lazey 1981). Solche Patienten zeigen, wenn der obere Atmungstrakt mit 
15 Pilzsporen in Kontakt gekommen ist, eine typische Typl-Allergie mit Symptomen 
wie Heuschnupfen und Asthma. Wenn Pilzsporen in einer solchen Typl-Antwort 
involviert sind, betragt die GroBe der Sporen mehr als 5pm. Die GroBenselektion 
begunstigt Pilze wie Cladosporium herbarum und Alternaria altemata als 
Allergieausldser. 

Cladosporium herbarum (bzw. die Sporen von Cladosporium herbarum) ist 
20 der am haufigsten vorkommende Pilz in der Luft (Gravesen 1979). Die sehr 
trockenen Sporen von Cladosporium herbarum konnen durch den Wind relativ leicht 
vertragen werden. In belasteten Zeiten ist es nicht selten, daB man an die 35000 
Konidien pro m 3 Luft findet. Durch die leichte Verschleppung der Sporen ist an 
solchen Spitzentagen auch in geschlossenen Raumen eine erhohte Sporenbelastung 
meBbar. Die Hauptbelastungszeit liegt zwischen Fruhling und Friihherbst. Diese 
25 hohe Konidienzahlen lassen sich damit erklaren, daB Cladosporium herbarum wegen 
seiner "genugsamen" Lebensweise nahezu uberall zu finden ist. Bevorzugte 
Lebensraume sind jedoch absterbende Pflanzen, verschiedene Bodentypen, aber auch 
diverseste Nahrungsmitteln. Nicht gereinigte KGhlschrSnke, Fensterrahmen, 
Strohdacher und verschiedene Textilien gehoren zu den weiteren Stand- bzw. 
Lebensorten dieses Pilzes. 
30 Aus diesen Grunden (ein Kontakt mit Cladosporium herbarum Sporen kann 

praktisch niemals ganzlich ausgeschlossen werden) ist es nicht verwunderlich, daB 
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Cladosporium herbarum zum Gegenstand intensiver allergologischer Forschung 
geworden ist. So reagieren zB. in Finnland 8% der asthmatischen Kinder positiv auf 
Cladosporium (Foucard et al. 1984). 

Die Beschreibung der allergenen Proteine von Cladosporium herbarum erfolgt 
mittels zum Teil aufwendiger molekularbiologischen Techniken. Die vermjutete Zahl 
5 von Cladosporium herbarum Allergenen liegt bei ca. 60 (Aukrust 1979, 1980). Das 
in der Literatur beschriebene Hauptallergen Clahl 1 wurde aus Rohextrakten 
aufgereinigt. Das Molekulargewicht liegt bei etwa 13kD. Klonierungen von diversen 
Cladosporium herbarum Allergenen sind noch nicht vorgenommen worden. Der 
Vorteil von gentechnologisch hergestellten allergenen Proteinen . bzw. deren 
Teilpeptiden (Voraussetzung dafiir ist jedoch eine immunologisch vergleichbare 
10 Reaktivitat - konnte bei Betula verucosa (Ferreira et al. 1993) und anderen Allegenen 
schon gezeigt werden) liegt: 

a) In def VCT&e^rung der Testsysteme wie RIA (R^idimmunassay), IRMA 
(Immunradiometrische Assay), ELISA (Enzyme-linked immunosorbent Assay), LI A 
(luminescense immunoassay), Immunblots, Histamine-release-assay, T-Zell 
Proliferationsassay und viele mehr. 

15 b) In der Verbesserung der Hyposensibilisierungstherapie: Diese Therapie 

besteht in der Zufuhr von Allergenextrakten in Form von Injektionen Oder peroraler 
Applikation in wassriger Form als Tropfen in steigender Dosierung, bis eine 
Erhaltungsdosis uber mehrere Jahre erreicht ist. Resultat dieser Therapie ist das 
Erreichen einer Toleranz gegenuber den eingesetzten Allergenen, was sich in einer 
Abnahme der Krankheitssymptome auflert (Birkner et al. 1990). Das Problem bei 

20 dieser Art der Behandlung liegt in der Vielzahl der dadurch auftretenden 
Nebenwirkungen. Bei der Hyposensibilisierungstherapie sind Falle von 
anaphylaktischem Schock wahrend der Behandlung aufgetreten. Das Problem hierbei 
liegt in der schweren Standardisierbarkeit der Pilzprotein-Isolate. Bei einem Einsatz 
von von Allergenen abgeleiteten aber nicht anaphylaktisch wirkenden Peptiden 
konnten risikolos hohere Dosen verabreicht werden, wodurch eine wesentliche 

25 Verbesserung der Hyposensibilisierung erreicht werden kann. 

c) Mit diesen Untersuchungen konnen aber auch spezifische T- und 
B-Zell-Epitope definiert werden. Solche Peptide besitzen die Fahigkeit zB. 
T-Lymphozyten zu stimulieren und zur Proliferation anzuregen, aber die Zellen (bei 
genau definierter Dosis) auch in einen Zustand der Toleranz bzw, Nicht-Reaktivitat 
(Anergie) zu versetzen (Rothbard et al. 1991). 

30 Erfindungsgemafi werden rekombinante DNA Molekule der eingangs 

genannten Art geschaffen, die Nucleinsauresequenzen aufweisen, die mit den 
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Sequenzen 1, 3-5, 7-9, 12-14 sowie 16 und 17, oder mit Teilbereichen dieser 
Sequenzen in homologer Weise iibereinstimmen, bzw. Nucleinsauresequenzen, die 
mit den genannten Sequenzen unter stringenten Bedingungen hybridisieren. Die 
DNA Molekule konnen auch Nucleinsauresequenzen aufweisen, die durch 
Degeneration von den vorgenannten, Sequenzen ableitbar sind. 

Weitere Merkmale gehen aus den nachstehenden Darlegungen hervor. 



a)Beschreibung der allergenen Proteine von Cladosporium herbarum mittels 
Western-Blotting 

Fur die Klonierung der vorliegenden Allergene von Cladosporium herbarum 
standen Sera von 142 Atopikern zur Verfugung. Urn die Reaktivitat der Patienten mit 

10 Pilzproteinextrakt zu testen, wurde Cladosporium herbarum (Sammlung Prof. 
Windisch [Berlin] Nummer: 28-0202) in Flussigmedium (2% Glukose, 2% Pepton, 
1% Hefeextrakt) gezuchtet und anschliefiend lyophilisiert. Aus diesem Material 
wurden sodann die allergenen Proteine ausgewaschen und mittels Lyophilisator 
aufkonzentriert. Die Auftrennung erfolgte auf einem denaturierenden 
Polyacrylamidgel, das anschliefiend geblottet, mit Patientenserum inkubiert und mit 

15 ,25 I-markiertem anti human IgE detektiert wurde. In Prozentzahlen ausgedruckt 
reagierten die Patienten auf die allergenen Proteine wie folgt: 



20 Wurde Protein aus gekauftem Pilzmaterial der Firma Allergon (Schweden) 

isoliert und fur den Immunblot verwendet, konnte nahezu dasselbe Bandenmuster 
detektiert werden.Somit konnen Clah53 und Clah47 in Bezug auf das uns zur 
Verfugung stehende Patientenspektrum als Hauptallergene, Clah22 und Clahll als 
Nebenallergene eingestuft werden. 

Die angeschlossenen zwei Figuren zeigen einen Uberblick fiber das zur 

25 Klonierung der beschriebenen Allergene zur Verfugung gestandene 
Patientenspektrum. Das erste der beiden Bilder zeigt ein 13,5 %iges Acrylamidgel. 
Die Patienten mit der Nummer 19 und 35 (es handelt sich hier auch urn die 
Patienten, die fur das spatere Screenen verwendet wurden) zeigen Banden in der 
GroBenordnung 53kD, 46kD und 22kD. Im zweiten Bild, es handelt sich hier urn ein 
17,5% Polyacrylamidgel, wird auch die kleine Molekulargewichtsbande (llkD) bei 

30 Patient 35 sichtbar. 



Beispiele: 



Clah53 
Clah47 
Clah22 
Clahll 



4% 



53% 
53% 
8.2% 
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Fig.l zeigt ein Westernblotting eines 13,5%iges Polyacrylamidgels nach 
Auftrennung von Cladosporium herbarum Proteinextrakt und Inkubation mit Sera 
verschiedener Patienten. 

Fig.2 zeigt eine Auftrennung von Cladosporium herbarum Proteinextrakt auf 
einem 17,5%igen Polyacrylamidgel; Inkubation mit Patientensera; Detektion mit 
5 Jod-markiertem anti-human IgE* 



b) Konstruktion der cDNA Expressionsbank 

Gesamt RNA wurde nach der sauren Guanidium-Phenol-Extraktionsmethode 
aus selbst gezuchtetem Pilzmaterial gewonnen. Poly(A)plus mRNA-Anreicherung 
10 erfolgte mit OHgo(dT) Cellulose der Firma Bohringer. Die cDNA Synthese (1. und 
2. Strang) wurde wie im Manual des Lambda ZAP-Systems der Firma Stratagene 
besehrieben durchgefuhrt. Die cDNA wurde anschliej3efRi (3" s - seitig) mit EcoRI und 
(S'-seitig) mit Xbal Linkern versehen, in vorverdaute Lambda-ZAP-Arme ligiert 
und veipackt. Der Titer der Primarbank betrug 1000000 Klone, 

15 c) Screening der cDNA Genbank mit Patientensera, in vivo Excision, Sequenzierung 
Das Screenen der Expressionsbank erfolgte mittels Inkubation der "gelifteten" 
Phagenplaques mit einem Seragemisch aus 2 Patienten, von denen man durch das 
Westernblotting wuflte, daB sie das Spektrum der detektierten Antigene abdecken. 
Die Detektion erfolgte wieder mit anti human IgE RAST Antikorper der Firma 
Pharmacia. Von den nach Sekundar- und Tertiarscreening ubriggebliebenen 200 

20 positiven Klonen wurden 30 mit Hilfe eines Helferphagen in vivo exzisiert und zu 
einem bereits fertig sequenzierbaren Bluescriptvektor religiert (Durchfuhrung wie im 
Manual des Lambda ZAP-Kits). Restriktionsverdaue der exzisierten Plasmide zeigten 
(EcoRI-Xbal Doppelverdaue) 4 verschiedene Inserttypen. Diese 4 Klone wurden 
nach der Sangermethode (Sanger 1977) sequenziert, 

25 d) Expression der Clah53, Clah47, Clah22 und Clahll cDNA's als 
fi-Galaktosidasefusionsprotein 
Mit Hilfe des vorher beschriebenen IgE-Screenings konnten vier vollstandige 
cDNA-Klone erhalten werden. Die jeweiligen rekombinanten Plasmide wurden in 
den E.coli Stamm XLl-Blue transformiert und mit IPTG 
(Isopropyl-B-D-thiogalactopyranosid) induziert. Der E.coli Gesamtproteinextrakt 
30 wurde ansschlieflend elektrophoretisch aufgetrennt und und auf Nitrozellulose 
geblottet. Das Fusionsprotein wurde mittels Serum IgE von Pilzallergikern und 
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einem mit einem I25 I-markiertem Kaninchen-anti human IgE Antikorper (Pharmacia, 
Uppsala Schweden) detektiert. 

Fig, 3 zeigt das rekombinante B-Galaktosidasefusionsprotein nach Inkubation mit 
Patientenserum und Detektion mit jodmarkiertem anti-human IgE. Der 
B-Galaktosidaseanteil des Fusionsproteins betragt 36 Aminosauren, was einem 
5 Molekulargewicht von 3800 Dalton gleichkommt. Unter Berucksichtigung dieser 
"VergroBerung" des allergenen Proteins ist auch dieFig. 3 zu sehen. Spur 1 (Klon 
1-1) und 4 (Klon 6-1) zeigen das rekombinante Fusionsprotein Clah47, jetzt urn den 
Fusionsanteil grofier. Spur 2 (Klon 3-2) zeigt das rekombinante Clah53 Allergen. 
Die rekombinanten Proteine von Clah22 und Clahll sind auf dieser Figur nicht zu 
sehen. 

0 Fig. 3 zeigt somit eine Expression der rekombinanten Proteine Clah47 und 

Clah53 im Vektor BS-SK+ nach IPTG Induktion. 



e) Bestimmung von B- und T-Zell Epitopen bei den rekombinanten Allergenen 

Die rekombinante Primarsequenz der Allergene bietet die Voraussetzung fur 
die Vorhersage von B- und T-Zellepitopen mittels geeigneter Computerprogramme. 

15 Die bestimmten Epitope werden jeweils bei der Beschreibung des rekombinanten 
Proteins in eigenen Figuren angefuhrt. Mit diesen Untersuchungen konnen 
spezifische T- und B-Zell-Epitope definiert werden die die Fahigkeit besitzen zB. 
T-Lymphozyten zu stimulieren und zur Proliferation anzuregen, aber die Zellen (bei 
genau definierter Dosis) auch in einen Zustand der Toleranz bzw. Nicht-Reaktivitat 
(Anergie) zu versetzen (Rothbard et al. 1991). 

20 Die Suche nach B-Zellepitopen wurde mit Hilfe des GCG-Programmes 

(Genetics-Computer-Group) "PROTCALC", das jedoch von der Arbeitsgruppe urn 
Prof. Modrow mit wesentlichen Parametern erweitert wurde, durchgefuhrt. Die 
Bestimmung beruht auf einer Abwagung der Parameter Hydrophilitat 
(Kyte-Doolittle), Sekundarstruktur (Chou-Fasman) , Oberflachenlokalisation 
(Robson-Garnier) und Flexibilitat, wodurch die Antigenitat von Teilpeptiden 

25 errechnet wird. 

Das Prinzip der T-Zellepitop-Voraussage erfolgte im Prinzip nach dem 
Algorithmus von Margalit et al. (1987). Das Prinzip besteht in der Suche nach 
amphipathischen Helices laut Primarsequenz des zu bestimmenden Proteins, flankiert 
von hydrophilen Bereichen. Der berechnete Score muB fur relevante T-Zellepitope 
groBer als 10 sein. Bei MHC II (major histo compatibility locus) assoziierten 
30 Peptiden kann kein Konsensus, weder der Sequenz noch der Lange des Peptids nach, 
wie bei HLA-A2 (human leucocyte antigen) assoziierten definiert werden. Bei 
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HLA-A2 assoziierten Peptiden betragt die Lange des Peptids 10 Aminosauren, wobei 
die 2, Aminosaure ein Tyrosin und die letzte Aminosaure ein Leucin darstellt 
(Rammensee et ah 1993). Die berechneten Epitope werden bei der Beschreibung der 
einzelnen allergeneh Sequenzen getrennt angefuhrt. 

5 Molekulare Charakterisierung der klonierten Pilzallergene (Sequenzprotokolle) 

Im folgenden Kapitel werden nun die cDNA Sequenzen und die mit ihnen 
durchgefuhrten Analysen der Reihe nach angefuhrt. Die Computerauswertung der 
nachfolgenden Sequenzen wurden auf einer Ultrix-DEC 5000 Workstation unter 
Zuhilfename des GCG-Softwarepaketes (= Wisconsin Paket: die Algorithmen dieses 
10 Paketes wurden von der Universitat Wisconsin entwickelt) durchgefuhrt. 

A, CIah53 

Die nachfolgende Sequenz 1 zeigt die vollstandige cDNA Sequenz und die 
daraus abgleitete Aminosauresequenz, beginnend mit dem Start-Methionin. Das 
berechnete Molekulargewicht betragt 53364 Dal ton und entspricht somit der GroBe 
15 nach dem im Westernblot detektierten allergenen Protein in der GroBe von 53kD. 
Dem reifen Protein durfte nach bisheriger Analyse kein Signalpeptid voranstehen. 
Der offene Leserahmen von Clah53 betragt 1491 Basenpaare bzw. 497 Aminosauren. 

Sequenz 1: Clah53=ALDH_clado -> 1 -phase Translation 53364 Dalton 
20 (1) ANGABEN ZU SEQ ID NO: 1 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1491 Basenpaare / 497 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 

(C) STRANGFORM: ds 
25 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 
Oil) HYPOTHETISCH: nein 

(iv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 

(vi) URSPRUNGLICHE HERKUNFT: 

JU (A) ORGANISMUS: Cladosporium herbarum 
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(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

DNA Sequenz 1491 b.p. ATGACTTCCGTC ... CTCTTCG GTTAG linear 

1/1 31/11 

ATO ACT TCC GTC CAG CTT GAG ACG CCG CAC TCC GGC AAG TAC GAG CAG CCG ACC GGC CTC 
aet thr ser val gin leu glu thr pro his ser gly lys tyr glu gin pro thr gly leu 
•61 / 21 91/31 
5 TTC ATC AAC AAC GAG TTC GTC AAG GGC CAA GAA GGC AAG ACC TTC GAT GTC ATC AAC CCC 

?5? 1 y e aSn aSn 9lu phe wl lys gly gln glu Sly lys thr phe asp val lie asn pro 
121 / 41 151/51 

TCC GAC GAG AGC GTG ATC ACC CAG GTC CAC GAG GCC ACC GAG AAG GAT GTC GAC ATC GCC 
ser asp glu ser val lie thr gin val his. glu ala thr glu lys asp val asp lie ala 
181 / 61 211 / 71 

Gtc GCC GCC GCC CGc CAA GCC TTC GAG GGC TCA tgg aga ctg gag aca CCC GAG AAC CGT 

*/* a of ala arg gln ala phe glu gly ser trp arg leu glu P"> asn arg 
241 / 81 271 / 91 

GGC AAG CTG CTC AAC AAC CTC GCC AAC CTG TTC GAG AAG AAC ACT GAC CTC CTT GCT GCC 

t% Xy , S lGU leU asn asn leu ala asn leu P he Slu lys asn thr asp leu leu ala ala 
301 / 101 331 / 1X1 

10 GT * ^ TCG CTC GAC AAC GGC AAG GCC ACT TCC ATG GCA AGG GtG ACA tcA CCA TGT GCG 

f ^ r leU asp asn gly lys ala thr ser TCt aia ar * va l thr ser ala cys ala 
361 / 121 391 / 131 

TCc GGC TGC CTC AGA TAC TAC GGT GGT TGG GCG GAC AAG ATC ACC GGC AAG GTC ATC GAC 
ser gly cys leu arg tyr tyr gly gly trp ala asp lys lie thr gly lys val ile asp 
421 / 141 451 / 151 

ACT ACG CCC GAC ACT TTC AAC TAC gTC AAG AAG GAG CCC ATT GGT GTT TGC cGG TCA GAT 

^of / aSp thr Phe asn tyr val lys lys glu P ro ile 9^ val cys arg ser asp 

481 / 161 511 / 171 

CAT tCC CTG GAA CTT CCC CTT CTC ATG TGG GCA TGG AAG ATC GGC CCG GCC ATT GCT TGC 

si? S / r J™ 1CU Pr ° lGU leU met trp ala trp lys lle gly P~ ala ala cys 

541 / 181 571 / 191 

15 G ? T AAC ACT 0X0 GTc CTG AAG ACT GCT GAG CAG ACC CCT CTT GGT GGT CTC GTC GCT GCC 

trX o«f Val Val leU lys thr ala glu gln thr pro leu gly gly leu val ala ala 

«01 / 201 631 / 211 

AGC CTC GTC AAG GAG GCC GGT TTC CCT CCT GGTGGTC ATC AAC GTC ATT TCC GGT TTC GGC 
«f / Xtl lyfi 9lU ala gly phe pro pro gly v* 1 lle asn val He ser gly phe gly 

AAG GTC GCT GGT GCC GCT CTC TCT TCT CAC ATG GAC GTC GAC AAG GTg gCC TTC ACC GGT 
iys val ala gly ala ala leu ser ser his net asp val asp lys val ala phe thr gly 

721 / 241 7S1 / 25x 

TCC ACC GTt GTC GGC cGC ACA ATC CTC AAG GCT GCT GcC tcT TCC AAC TTG AAG AAG GTC 
? «J ^ 9ly " g thr ile leu lys ala ala ala ser se r a *n leu lys lys val 
ffC cTC GAG CTC GGT GGC AAG TCA CCA AAC ATT GTC TTC GAG GAC GCC GAT ATT GAC AAC 

oVf X T* ?« U lGU gly gly lys ser pro asn ile ^1 P he 9 Xu as P a l a asp ile asp asn 
B41 / 281 e71 / 291 

gCC ATC TCA TGG GTC AAC TTC GGT ATC TTC TTC AAC CAC GGC CAG TGC TGC TGT GCT GGT 

7£ / tXP aSn phe gly Ale phe P he asn hia ff!y 9 ln <=y» cys cys ala gly 

™ J 3 °1 931 / 311 

TCG CGT GTG TAC GTT CAG GAG AGC ATC TAC GAC AAG TTC GTC CAG AAG TTC AAG GAG CGC 
o<f a / g ^ tyr Val gln glu ser ile tyr as P iys *> he vai ffl" ly» Phe lys glu arg 
GCA CAG AAG AAC GTT GTT GGC GAC CCC TTC gcC GCC GAC ACA TTC CAG GGT CCT CAG GTT 

?o?i g / n X? aSn Val Val gly asp pro phe ala afi P ttr P he gXn gly pro gln val 
o<r " Z1 ' 341 1051 / 351 

£D TCC AAG GTT CAG TTC GAC CGC ATT ATG GAG TAC ATC CAG GCC GGC AAG GAC gec gGT gCC 

?nL / 9ln Phe asp arg lle met glu tyr ± le 9ln ala gly lys asp ala gly ala 

r~ mi / 371 

ACC GTC GAG ACC GGT GGA AGC cGT AAG GGT GAC AAG GGC TAC TTC ATT GAG CCC ACC ATC 
??!;- Val fi? thr gly gly Ser arg lys gly as P lys 5ly tyr phe ile glu pro thr ile 
iil J 1X71 / 391 

TTC TCC AAC GTC ACA GAG GAc ATG AAG ATC GTG AAA GAG GAG ATC TTC GGC CCC GTC TGc 

aSn ^ thr glu asp lnet lys xlG val ly s 5lu glu ile phe gly pro val cys 
1201 / 401 1231 / 411 

tCG ATC GCC AAG TTC AAG ACC AAG GAG GAC GCC ATC AAG CTC ggc AAC GCC AGC ACA TAC 
? e f, A ^ e ala lya Phe Xys thr lys glu as P aia lic ly fl le« gly asn ala ser thr tyr 
on i ' i29 i / 43 i 

GGT CTC GCC GCC GCC GTC CAC ACC AAG AAC CTC AAC ACC GCC ATC GAG GTC TCC AAC GCT 

fS, 1 ^ a - & ala ala hls thr lys asn Xeu asn thr aia He gl« val ser asn ala 

1321 / 441 1351 / 451 

CTC AAG GCG GGC ACC GTC TGG GTC AAC ACT TAC AAC ACC CTC CAC CAC CAG ATG CCg TTC 
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leu lys 


ala 


gly 


thr 


val 


txp val 


asn 


thr 


tyr asn 


thr leu 


his 


his 


gin met pro phe 


1381 / 


461 














1411 / 


471 






CGT GGC 


TAC 


AAG 


GAG 


TCC 


GGT ATT 


GGC 


CGT 


GAG CTC 


GGC GAG 


GAT 


GCC 


TTO GCC AAC TAC 


gly gly tyr 


lys 


glu 


ser 


gly ale gly 


arg 


glu leu 


gly glu 


asp 


ala 


leu ala asn tyr 


1441 / 


481 














1471 / 


491 




ACT CAG 


ACC 


AAG 


ACT 


GTT 


AGC ATT 


CGT 


CTC 


GGT gAC 


GCC CTC 


TTC 


GGT 


TAG 


thr gin 


thr lys 


thr 


val 


ser lie 


arg 


leu 


gly asp 


ala leu phe 


gly AMB 
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Eine Homologiesuche der gezeigten Proteinsequenz in der 
SWISSPROT-Proteindatenbank zeigte signifikante Homologie des Proteins zu 
verschiedenen Aldehyddehydrogenasen. Das nachfolgene "multiple Alignment" mit 
ALDH-Sequenzen von Aspergillus, Rind, Pferd, Maus, Ratte, Mensch, E.coli. 
Pseudomonas sowie den Pilzen Cladosporium herbarum und Alternaria alternata 
spiegelt die hohe Homologie von Clah53 zu Aldehyddehydrogenasen wieder (Seq.2). 
Der ermittelte Konsensus zeigt Identitaten von Aminosauren quer durch alle 
Organismen. 



Sequenz 2: 



1 50 

plleup. ms£<AXDH_alt) M tSvklstpqt g. .EFE.QpT glFXHHEFvfc 

15 plleup. asf{AXJ>H_clado> M tSvqletphs g. .JtYE.QpT glFIHNEPVX 

plleup. ms£<AI£>H_asp) mSdlfttXet FvlXYE.Qpl glFIHHEFvk 

pileup.msf <dhaxn_bovin) mlravalaaa rlgprqgrrX. lSaAtqaVFt PnqqpEVlyn qXFXHHEWHd 

plleup. ms£{dham_horse) aaaAtqaVFa PnqqpEVfyn qXFXHHEWHd 

plleup. msf{dhac_mouse) SSpAqPrVPa FX«aDXJcXQhT KXFIHHEWHn 

plleup. msffdhac^rat) SSpAqPaVPa PLanDtlQhT XXFXHHEWHn 

plleup. ma f {dhac__human) SS a gtPdlPv ILtDXJcXQyT KIFIHHEWHd 

plleup. maf{dhab_ecoli) srmaeq qlYXhggYts 

plleup. ms£<dns>c_j>sepu) mkel KhFXHgaFvg 

Consensus ---------- — — — « — . - — »_x— 

51 100 

20 pileup.ms£<AXDH_alt> aVdGKTFdVX HPsTEEVICa VqEateXDVD lAVaAARkAF n. . gPWaket 

plleup. msf {AXDH_dado> gqeGKTFdVX NPadEaVItq VhEateXDVD lAVaAARQAF e. .gsKRlet 

plleup. msf <AXJ3H_asp} gVeGXTFqvi HPsnEkVXts VhEateXDVD vAVaAARaAF e. .gPNRqvt 

plleup.ms£{dham_b«rvln} aVSkXTFPtV HPsTgCVXCh VaEgDKADVD rAVKAARaAF QIGSFWRrMD 

pll eup .msti dham_hor se > aVSWCTFPtV HPsTgEVXCq VaagOKeDVD rAVKAARaAF QlOSPWRrKD 

plleup.tasf <<Jhac_mouse) sVSGKXFPVl HPaTEEVXCh VeEgDKADVD XAVKAARQAF QXGSPWRTHD 

plleup. nsr* <dhac_rat) slnGKXFPVI HPaTEEVXCh VeEgDKADVD kAVKAARQAF QXGSPWRTHD 

plleup . mat I dhac_human > sVSGKJcFPVf KPaTEEelCq VeEgDKeDVD kAVKAARQAF QXGSPWRTHD 

plleup.maf {dhab_ecoli> atSGrTFetX HPangnVlat VqaagreDVD rAVKsAqQgq k...lWaaWt 

plleup. ma f (dmpc_psepu> saSGrTFedV NPangqVXar VhEagrAEVD mAVqAARaAX, k. .gPWgkMs 

Consensus — F HP — V VD -AV— A— — — — - H— — 



25 



plleup . ms£ (AXDH_alt) 
plleup. maf <ALDH_clado) 

plleup. msf<ALDH_asp) 
plleup ,msf{ dham_t>ovln ) 
plleup . mst { dham — horse ) 
plleup . mst { dhac_mouse } 

pi leup . ms£ < dhac__ra t ) 
plleup. msx^dhac_ human) 
plleup .msf < dhab_ecoll ) 
2Q plleup. msffdmpc^psepu) 
Consensus 



101 

penRGkXXHK 
penRGkXXHn 
pSERGlXlHK 
ASERGRLLHr 
ASDRGRLLNr 
ASERGcLLHK 
ASERGcXXHK 
ASERGRLLyK 
AmERsRILrr 
vSERaelLhr 



XADLFEknaD 
XAnLFEkntD 
LADLMERD1D 
XADI^lERDRt 
XADItlERDRt 
XADLKERDR1 
LADLMERDRv 
XADUERDR1 
avDiLrernD 
vADgltar£D 



LlAAvEaUDN 
UAAvESLDH 
tXAAiESLDH 
yXAALEtLDH 
yXAALEtXJDH 
LlAtMEaXjig 
XXAtKESMna 
LXAtKESMng 
eUOO-EtLDt 
eFleaEcXDt 
E 



GKAFSMAknV 
GKAtSKAr.V 
GXAFtMAk.V 
GKpYll*YX»V 
GKpYvisTLV 
GKvFanATLs 
GKlFthAYXa 
GXlYSnATLn 
GKAYSetstV 
GKpkSXAshX 
GX — — 



150 

DvpaaagGXJR 
tsaeasgCXJl 
DXAnsXgCXA. 
DLdnvOXCLR 
DLdravlXCLR 
DLggcXXaXJt 
Dtev»XKaX*k 
DLagcIKtLR 
DlvtgadvX^e 
DlprgaanFK 
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plleup . ms f < ALDH_al t ) 
plleup . msf ( ALDH__clado } 

plleup . msf { ALDH_asp) 
plleup . msf { dhaia_bovin) 
plleup . msf { dh anchors e > 
pileup . msf (dhacTjnouse > 

pi leup . msf ( dhac_rat > 
pileup . msf ( dhacjmman } 
plleup . msf { dhatoTecoli ) 
f plleup.msf (dmpc^psepu) 
Consensus 



151 

YYgGW. . 
YYgGW. . 
YYAGW. . 
YYAGW. . 
YYAGW. . 
YGAGW. . 
YFAGW. . 
YCAGW. . 
YYAG11 . 



. -A 
. .A 
. .A 
. .A 
. .A 
. .A 
. .A 
. .A 
• F* 



vFAdllknvA 



DKXeGKWdt 
DKltGKvZdfc 
DKZHGqTZdt 
DKyHGKTZFl 
DKyHGKTIPl 
DKIHGqTIPs 
DKIHGqTIPs 
DKIqGrTIPi 
legsqiplre 
teafematFd 



apDsFnYlRX 
tpDtFnYvkk 
npE tXTYTRh 
DGDYFsYTRh 
DGDFFsYTRh 
DGDlFTYTRr 
DGDvFTYTRr 
DGnFFTYTRh 
ts. . FvYTRr 
gsgainYavr 



. sllVf avrs 
BFZGVCrsdh 
EPVGVCGQZZ 
EPVGVCGQZZ 
EPVGVCGQZZ 
EPZGVCGQZZ 
EFZGVCGQZZ 
EPZGVCGQIZ 
EFlGWaglg 
rPkGVlGvls 



200 

smeLPlLMWa 
aleXPIXKWa 
FWNFFLLKWs 
PWNFPLXMqa 
PWHFPLUfqa 
FWHFPMLMFi 
PWNgPLlLFi 
PWHFPLvKLi 
aWHYPlqlal 
PWNZ^LLLmt 
P 
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pileup . msf { ALDH_alt ) 
pileup . msf { ALDH__clado) 

pileup. msf (AI*DH_asp) 
pileup . msf { dham_bovin > 
plleup. msf (dhamjhorse) 
plleup . msf (dhacjmouse > 

plleup . msf ( dhac_rat ) 
pileup . msf { dhac_human ) 
plleup . msf { dhab_ecoli } 
pileup . msf { dnpcTjpsepu > 
Consensus 



201 

WKZGPAiAtG 
WKIGPA1ACG 
WKI GPAvAaG 
WKlGPAIAtG 
aKIGPAIAtG 
WKI GPAI*sCG 
WKZGaALsCG 
WKI GPALsCG 
WKsaPAIAaG 
WKVGPAZACG 
-K A G 



KTWLKtAEQ 
HTWIXtAEQ 
NTWLKtAqQ 
KWVMRvAEQ 
NvWMKvAEQ 
NTVWKPAEQ 
NTVIvKPAEQ 
NTVWKPAEQ 
NamlFKPsEv 
HTVWKPsEe 
N K 



TPLsAylack 
TPLggLvaAS 
TPI.sAI.YaAk 
TPLTAI*YvAn 
TPI.TAI.YvAn 
TPLTALhIAS 
TPLTALYMAS 
TPLTALhvAS 
TPLTAUtZAe 
TPI/TtalLge 
TPL 



Z.ZqEAGFFFG 
XiVKEAGFPPG 
LZKEApFFaG 
&ZKEAGFFPG 
XitKEAGFPPG 
Z.ZKZAGFFPG 
Z.IKEAGFFPG 
Z.ZKEAGFPFG 
lysEAGLPdG 
vinqaAGvPaG 
A — P-G 



250 

VZWVZtGFGk 
VZHVZsGFGk 
VZNVZsGFGr 
WNVZPGFGP 
WMWPGFGP 
WMZVPGYGP 
WWWPGYGs 
WNZVFGYGP 
VfKVlPGvGa 
VyNWhGFGP 
V-H G-G- 



pileup . msf { ALDH_al t ) 
pileup . msf ( ALDH_clado) 

plleup . msf (ALDH_asp } 
pileup. msf {dhanJ>ovln) 
15 Pileup. msf (dhamjhorse) 
plleup. msf (dhacjoouse) 

pileup . msf ( dhae__rafc) 
pi leup . ms f { dhac_human ) 
pileup . msf f dhab_ecoli ) 
pileup . msf < dmpc_psepu } 
Consensus 



251 

. lAGAAmSaH 
. VAGAAISSH 
• TAGAAZSSH 
. TAGAAZ aSH 
. TAGAAXaSH 
. TAGAAZSSH 
.TAGAAZSSH 
. TAGAAZSSH 
E. tGqylteH 
DsAGAflteH 



KDZDKZAFTG 
MDVDKVAFTG 
KDIDKVAFTG 
eOVDKVAFTG 
eDVDKVAFTG 
MDVDKVAFTG 
MDIDKVsFTG 
MDZDKVAFTG 
pgl aKVsFTG 
pDVnaZtFTG 
FTG 



STWGrqIMk 
STWGrtZUc 
STIVGptZLq 
STEVGhUEgv 
STEVGhLIqv 
STqVGKZfZkE 
STEVGKLZkE 
STEVGKLZ kE 
gvasGKkVMa 
eTrtGeaZM. 



sAagSNXKXV 
AAasSHZJCkV 
AAaKSHLKkV 
AAgKSHUCrV 
AAgrSNUOtV 
AAgKSNZJCrV 
AAgKSNUCrV 
AAgKSNLKrV 
nsaaSsLKeV 
rAaakgvxpV 



300 

TLELGGKSPN 
TZXLGGKSFN 
TZ-ELGGKSPN 
TLE1GGKSPN 
TLELGGKSPH 
TLELGGKSPc 
TZXZ«GGXSPc 
TLELGGKSPc 
TMEIpGGKSPI 
sFELGGKnag 
— E-GGK 



pileup. msf (AZDH_alt) 
pileup . ms f { ALDH dado) 
20 Pil««P-»sf{Az5H_asp) 
pileup. msf {dham_bovin> 
plleup . msf { dhanThorse ) 
plleup . msf { dhacjmouse ) 

plleup . msf ( dhae_rafc ) 
pileup . msf < dhacjhuman) 
plleup . msf (dhabTecoli ) 
plleup .msf {dropc3>*epu ) 
Consensus 



301 

IVFADADLDe 
ZVFeDADlDN 
IVFdDADlDN 
ZZMsDADMDw 
ZZvsDADMDw 
IVFADADLDi 
ZVFADADLDs 
ZVZADADLDH 
ZVFdDADLDl 
ZVFADcDIJDk 
Z D-D-D- 



AZhWvnFGZY 
AZsHvnFGZF 
AZSWAnFGZF 
AVEqAHFalF 
AVEqAHFalF 
AVEFAHhGVF 
AVEFAHqGVF 
AVEFAHhGVF 
AaDlAmmanF 
AZEgsmrsVF 



FNhGQaCCAG 
FNhGQCCCAG 
FNhGQCCCAG 
FH0GQCCCAG 
FNQGQCCgAG 
YhQGQOCVAa 
FhQGQiCvAa 
YhQGQCClAa 
FssGQvCtnG 
aNgGQvClgt 



SRZYVQEeZY 
SRVYVQESZY 
SjaLVQEgZY 
SRtFVQEdZY 
SRtFVQEdVY 
SRXFVeESVY 
SRlFVeESZY 
SRIFVeESZY 
tRVFVpaXck 
eRlYVerpZF 



350 

DXFZQRfkER 
DkFVQkfXER 
DkFVaRfkER 
aEFVeRSVaR 
aEFVeRSVaR 
DEFVkRSVER 
DEFVrRSVER 
DEFVrRSVER 
aaFeQXllaR 
DEFVaRlkag 



351 

25 pileup . msf { AI«DH_alfc ) AaqnaVGdPF aa.TlQGPQV sqlOFDrZMg YZEeGKJcsGA 

pileup .msf {AID H^cl ado) AqKnWGdPF aadTfQGPOV sKvQFDrZME YZqaGKdaGA 

pileup. insf <ALDH_asp) AqKnkVGKPF EqdTfQGPQV sqlQFDrlME YZnhGKXaGA 

plleup. msf {dham^bovin} AKsrWGKPF DsrTeQGPQV detQFXKVLg YZkSGKeEGl 

pileup. msf (dhamjhorse) AKsrWGNPF DsqTeQGPOV detQFnKVLg YZkSGKeEGA 

plleup. msf (dhacjmouse) AKKyVlGNPL tPginQGPQZ dKEQhDKZLD 1ZESGKXEGA 

pileup. msf (dhac_rat) AKKyVlGNPL DsgisQGPQZ dKEQhaKZZJ) HESGKkEGA 

plleup. msf (dhac_human) AKKyllGHPI* tPgvtQGPQZ dKEQYDKZLD lZESGKkEGA 

plleup. msf (dhab_ecoli) verlraGdVF DPqTnfGPIV sfphrDnVLr YZakGKeEGA 

plleup. msf (dmpc_psepu) AeslVZGtPd DPqanfGPlZ slqhrEKVLs YyqkavdEGA 

Consensus — — -g — -™ -GP-- . q« 



400 

tiEtGGnRXG 
tvEtGGsKkG 
tvatGGdRhG 
KllCGGGaaa 
KllCGGGaaa 
X1ECGGGPKG 
X1ECGGGRWG 
KlECGGGpKG 
rvlCGGdVlk 
twtGGGvpe 
GG — — 



30 



401 



450 
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pileup.msf (ALDH_alt) DKGYF lePTIFSNVT EDMJcIqqEEI FGPVctI sKF KtkaDVIKig 

pi leup . ms f { ALDH_clado > DKGYF IePTIFSNVT EDMklvKEEI FGPVcsIaKF KtkEDalKlg 

pileup.msf (AI-DH_asp) neGYF IQPTVFtdVT sDMXIAqEEI FGPWfclqKF KdVaEalKig 

pileup .msf {dham_bovin} DrGYF IQPTVFgdlq DgMtlAKEEI FGPVmQILKF KSmEEWgRfc 

pileup.msf {dham_horse) DrGYF IQPTVFgdVq DgMtlAKEEI FGPVmQILKF KtlEEWgRA 

pileup.msf (dhac_mouse) nXGFF VQPTVFSKVT DEMxIAKEEI FGFVqQIMKF KSVDDVIKRA 

pileup.msf <dhac__rat) nKGFF VQPTVFSNVT DEMrlAKEEI FGFVqQIMKF KSIDEVIKRA 

pileup . msf { dhac_human > nKGYF VQFTVFSHVT DEMrlAKEEI FGFVqQIMKF KS1DDVIKRA 

pileup.msf <dhab_ecoll) .gdgFDnGaW VaPTVFtdcs DDMtlvxEEI FGFVmsILtY eSeDEVIrRA 

pileup t .msf <dmpc_psepu) mpaeLagGaW VQPTIWtgla DgaaWtEEI FGPcchlrpF dreEEaVelA 

Consensus — G — — PT— - — — — - — --EEI FGP I- - 



pileup . ms f { ALDH_al t } 
pileup.msf {ALDH_clado} 

pi leup . ms f { ALDH_asp ) 
pileup . msf { dham_bovln } 
pileup . msf { dham_horse ) 
pi leup . msf { dhac__mouse ) 

pileup . msf { dhac_rat ) 
pileup . ms f < dh ac_ human > 
pileup.msf <dhafe_ecoli) 
1U pileup.msf (dmpc_psepu) 
Consensus 



451 

HNTTYGLsAA 
KasTYGIAAA 
HsTdYGLAAA 
HHskYGIAAA 
KKskYGIAAA 
NNTTYGIAAg 
NKTpYGLAAg 
NNTfYGLsAg 
NdTdYGIAAg 
HslpYGIAAt 
N YGL-A- 



VhTsnLttAI 
VhTKnLntAI 
VhTKnvntAI 
VFTKDLDKAn 
VFTKDLDKAn 
1FTKDLDKAI 
VFTKDLDrAI 
VFTKDiDKAI 
IvTaDLnrAh 
IWTentsrAh 
«T A- 



eVanALrAGT 
eVSnAUcAGT 
rVSnAXJcAGT 
ylSqALQAGT 
ylSqALQAGT 
tVSsALQAGv 
tVSsALQAGT 
tISsALQAGT 
rVihqLeAGi 
rVagqLeAGi 
L-AG- 



VWVNsYHtXh 
VWVNtYHtXh 
VWIHnYHmiS 
VWVNCYdvFg 
VWINCYdvFg 
VWVNCYlmLS 
VWVNCYltLS 
VWVNCYgwS 
cWINtWgesp 
VWVNsHflrd 
-W-H 



500 

wQl FFGGYKe 
hQmPFGGYKe 
yQaPFGGFKq 
AQsPFGGYKL 
AQsFFGGYKM 
AQCPFGGFXM 
vQcPFGGFKM 
AQCPFGGFKM 
AemPvGGYKh 
IrtaFGGsKq 
GG-K- 



pi 1 eup . msf { ALDH_al t > 
pileup.msf {ALDH_ dado) 

pileup . msf < AXDH_asp ) 
pil eup . msf < dh amjaovin ) 
pileup . msf { dhamjhorse ) 
pileup . msf { dhac_mouse ) 

pileup.msf {dhac__rat} 
15 pileup.msf {dhac_human) 
pileup . ms f < dh ab_ ecol 1 ) 
pileup . msf { dmpc_psepu ) 
Consensus 



501 

SGlGRELGEa 
SGlGKELGEd 
SGlGRELGsY 
SGsGRELGEY 
SGnGREI^EY 
SGnGRELGEh 
SGnGREMGEq 
SGnGRELGEY 
SGlGREnGvm 
SGlGREgGvh 
SG-GRE-G — 



aLdnYiqtKT 
aLanYTqtXT 
aLenYTqIKT 
GLqaYTEVKT 
GLqaYTEVKT 
GLyeYTElKT 
GvyeYTElKT 
GFheYTEVKT 
tLqsYTqfVKS 
sLefYTElKn 



532 

Vslrlgdvlf G2 
Vslrlgdalf GZ 
Vhyrlgdalf a. 
VTVrvpQKNS . . 
VTIKvpQKHS . . 
VamKl s QKNS . . 
VamKiaQKNS . . 
VTVKlsQKNS . . 
IgVemakfqS if 
IcVKl 



Die NAD-abhangige ALDH ist das Hauptenzym, das an der Oxidation von 
^ Azetaldehyd, ein Primarprodukt des Alkoholmetabolismus, im Menschen beteiligt 
ist. Isoenzyme sind hierbei oft zu finden (Harada et al. 1982). Beim Menschen z.B. 
findet man das Isoenzym ALDH I in Mitochondrien, ALDH II im Zytoplasma. 
Interessanterweise ist die Abwesenheit von ALDH I bei Asiaten keine Seltenheit 
(Harada et al.1982). Die Defizienz von ALDH I resultiert in einem hohen Spiegel 
von Acetaldehyd, was sich als sogenanntes "flushing syndrome", sowie anderen 
vasomotorischen Symptomen nach AlkoholgenuB bemerkbar macht. Der 
Isoenzymverlust laBt sich auf eine Mutation zuruckfuhren, die das native Protein in 
seiner Struktur verandert (Hsu et al. 1987). Der Zusammenhang zwischen ALDH 
und Allergieauslosung ist zum Zeitpunkt noch nicht bekannt. 

Die nachfolgende Sequenz 3 zeigt die mit Computersuche identifizierten 
Bereiche mit hohem antigenem Index. Diese Bereiche stellen hochpotente 
B-Zellepitope dar. 
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Sequenz3: CIah53=ALDH_cIado: B-Zellepitope 
5 (1) ANGABEN ZU SEQ ID NO:3 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 
10 (Hi) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

15 

Ser Val Gin Leu Glu Thr Pro His Ser Gly Lys Tyr Glu Gin Pro Thr Gly (3-19) 
Asn Asn Glu Phe Val Lys Gly Gin Glu Gly Lys Thr Phe (23-35) 
lie Asn Pro Ser Asp Glu Ser Val lie (38-46) 

Ala Ala Ala Arg Gin Ala Phe Glu Gly Ser Arg Lys Glu Thr Pro Glu Asn Arg Gly Lys Leu Leu 
Asn (62-84) 

20 Cys Ala Ser Gly Cys Leu Arg Tyr Tyr Gly Gly Trp Ala Asp Lys Xle Thr Gly (118-135) 

X.ys Val He Asp Thr Thr Pro Asp Thr Phe Asn Tyr Ser Arg Arg Ser Pro Leu Val (136-154) 
I«eu Lys Thr Ala Glu Gin Thr Pro Leu GlyGGly (184-194) 

Ala Ser Leu Val Lys Glu Ala Gly Phe Pro Pro Gly Val He Asn (198-212) 
Ala Ala Ser Ser Asn Leu Lys Lys Val Thr Leu (250-260) 
Glu Leu Gly Gly Lys Ser Pro Asn He Val Phe (261-271) 
25 Tyr Asp Lys Phe Val Gin Lys Phe Lys Glu Arg Ala Gin Lys Asn Val Val Gly (308-325) 

Tyr He Gin Ala Gly Lys Asp Ala Pro Ser Thr Val Glu Thr Gly Gly Ser Gly Lys Gly Asp Lys 
Gly Tyr Phe He (349-374) 

He Ala Lys Phe Lys Thr Lys Glu Asp Ala He Lys Leu Asn Ala Ser Thr Tyr Oly Leu Ala 
(400-420) 

Trp Val Asn Thr Tyr Asn Thr Leu His His Gin Met Pro Phe Gly Gly Tyr Lys Glu Ser Gly Xle 
30 Gly Arg Glu Leu Gly Glu (444-471) 

Asp Ala Leu Ala Asn Tyr Thr Gin Thr Lys Thr Val Ser He (472*485) 



"OOCIO: <WO QVIfi1?1A5 I -* 
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Die nachfolgende Sequenz 4 zeigt die mit Hilfe des Computerprogrammes 
bestimmten amphipathischen Helices, die von hydrophilen Bereichen flankiert 
werden. Solche Bereiche, mit einem Score hdher als 10, stellen mogliche 
T-Zellepitope dar. 

5 

Sequenz 4: Vorausgesagte amphipathatische Segmente 
T-Zellepitope 



PHSGKYE 

KTFDVIN 
10 KLLNNLANLFE 

AAVESLDNGKATS 

GGLRYYGGWADKXTGKVJDTTP 

GVINVISGFGKVAGAAL 

IYDKFVQKFKERAQKNV 

QFDRIMEYIQA 

APSTVETGGSG 
15 FSNVTEEM 

EVSNALK 

NTYNTL 

RELGEDALANYTQT 



(1) ANGABEN ZU SEQ ID NO:4 

20 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Pro HI a ser Gly Leu Lya Tyr Glu (9-15) 
Lys Thr Phe Asp Val lie Asn (27-31) 

30 

L.y» Leu Leu Asn Aan Leu Ala Asn Leu Phe Glu (81-91) 



.9506t21A2_l_> 
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Ala Ala Val Glu Ser Leu Asp Asn Gly Lys Ala Thr Ser (98-110} 

Gly Cys i*u Arg lyr Tyr Gly Gly Trp Ala Asp Lys lie Thr Gly Lys Val lie Asp Thr Thr Pro 
(121-142) 

Gly Val lie Asn Val lie Ser Gly Phe Gly Lys Val Ala Gly Ala Ala Leu <209-225) 
He Tyr Asp Lys Phe Val Gin Lys Phe Lys Glu Arg Ala Gin Lys Asn Val (307-323) 
5 Gin Phe Asp Arg lie Met Glu Tyr lie Gin Ala (342-352) 
Ala Pro Ser Thr Val Glu Thr Gly Gly Ser Gly (356-366) 
Phe Ser Asn Val Thr Glu Glu Met (379-386) 
Glu Val ser Asn Ala Leu Lys (433-439) 
Asn Thr Tyr Asn Thr Leu (446-451) 

Arg Glu Leu Gly Glu Asp Ala Leu Ala Asn Tyr Thr Gin Thr (467-480) 

10 

Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
Midpoints, die N-terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flankiert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" grofler als 10 ist. 

15 B. Clah47 

Die nachfolgende Sequenz 5 zeigt die vollstandige cDNA Sequenz des 
allergenen Proteins Clah47. Die Aminosauresequenz wurde von der DNA Sequenz 
hergeleitet. Auch bei diesem Protein sind keine Anzeichen einer Signalsequenz 
vorhanden. Die Gesamt DNA Sequenz betragt 1323 Basenpaare, was einer 
Proteinlange von 441 Aminosauren entspricht. Das berechnete Molekulargewicht des 
20 rekombinanten Proteins betragt 47617 Dalton und entspricht somit der detektierten 
Bande (47kD) im Westernblot. Wie zu Beginn erwahnt, wird das allergene Protein 
mit dem Molekulargewicht von 47kD von 53% der Patienten erkannt und stellt somit 
ein wichtiges Hauptallergen dar. 

25 Sequenz 5: Clah47=Enolase_clado - > 1-phasen Translation 47617 Dalton 
(1) ANGABEN ZU SEQ ID NO:5 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1323 Basenpaare / 441 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 
30 (Q STRANGFORM: ds 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 

(iii) HYPOTHETISCH: nein 

(iv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 
5 (vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum 
(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 



DNA Sequenz 1323 b.p. ATG CCT ATCTCC ... ATCAACTTGTAA linear 

10 1 / 1 31/11 

ATG CCT ATC TCC AAG ATC CAC TCC CGC TAC GTC TAG GAC TCC CGT GGA AAC CCC ACC GTC 
met pro lie ser lys lie his ser arg tyr val tyr asp ser arg gly asn pro thr val 

/ 21 91 / _31 __ 

GAG GTC GAC ATT GTC ACC GAG ACC GOT CTT CAC CGC GCC ATT GTC CCC TCT GTT GCC TCT 
glu val asp lie val thr glu thr gly leu his arg ala lie val pro ser val ala ser 
121 ./ 41 15 1 / 51 

ACC GGC TCC CAC GAG GCT TGC GAG CTC CGT GAT GOT GAC AAG AGC AAG TGG GCT GGC AAG 
thr gly ser his glu ala cys glu leu arg asp gly asp lys ser lys trp ala gly lys 
181 / £1 211 / 71 

GGT GTG ACC AAG GCT GTT GCC AAC GTC AAC GAG ATC ATT GCT CCC GCT CTC ATC AAG GAG 
gly val thr lys ala val ala asn val asn glu lie lie ala pro ala leu lie lys glu 
15 241 / e l 271 / 91 

AAC CTC GAC GTC AAG GAC CAG GCC GCC GTT GAC GCT TTC CTC AAC AAG CTC GAT GGC ACC 
asn leu asp val lys asp gin ala ala val asp ala phe leu asn lys leu asp gly thr 

301 / 101 331 / 111 

ACC AAC AAG ACC AAG ATT GGT GCC AAC GCC ATC CTC GGT GTC TCC ATG GCT GTG GCC AAG 
thr asn lys thr lys lie gly ala asn ala lie leu gly val ser net ala val ala lys 
361 / 121 391 / 131 

GCT GCC GCC GCC GAG AAG CGT GTC CCT CTC TAC GCC CAC ATC AGC GAC CTT TCC GGC ACC 
ala ala ala ala glu lys arg val pro leu tyr ala his lie ser asp leu ser gly thr 
421 / 141 451 / 151 

AAG AAG CCC TTC GTT CTC CCC GTT CCC TTC ATG AAC GTC GTC AAC GGT GGC TCC CAC GCg 

20 lya lys pro phe val Xeu P ro val Pro phe met asn val val asn gly gly ser his ala 
461 / 161 511 / a71 

GGT GGC CGT CTT GCC TTC CAG GAG TTC ATG ATC GTT CCC AGC Ggg GCT CCC TCC TTC ACC 
gly gly arg leu ala phe gin glu phe met ile val pro ser gly ala pro ser phe thr 
541 / 181 571 / I91 

GAG GCC ATG CGC CAG GGT GCT GAG GTC TAC CAG AAG CTG AAG TCC CTC ACC AAG AAG AGG 
glu ala met arg gin gly ala glu val tyr gin lys leu lys ser leu thr lys lys arg 
601 / 201 631 / 211 

TAC GGC CAG TCT GCC GGC AAC GTC GGT GAC GAG GGT GGT GTC GCT CCC GAT ATT CAG ACC 
tyr gly gin ser ala gly asn val gly asp glu gly gly val ala pro asp ile gin thr 
661 / 221 691 / 231 

GCT GAG GAG GCT CTT GAC CTC ATC ACC GAC GCC ATT GAG GAG GCC GGC TAC ACT GGC CAG 

25 9lu glu ala leu Asp leu lle thr as P aia *1* Sl« STlu ala gly tyr thr gly gin 
721 / 241 751 / 251 

ATC AAG ATC GCC ATG GAC gtt GCC TCC TCC GAG TTC TAC AAG GCC GAC GAG AAG AAG TAC 
ile lys ile ala met asp val ala ser ser glu phe tyr lys ala asp glu lys lys tyr 
781 / 261 811 / 271 

GAC CTt GAC TTC AAG AAC CCC GAC TCT GAC AAG AGC AAG TGG ATC ACC TAC GAG CAG CTT 
asp leu asp phe lys asn pro asp ser asp lys ser lys trp ile thr tyr glu gin leu 
841 / 281 871 / 291 

GCC GAC CAG TAC AAC GAG CTC GCT GCC AAG TAC CCC ATT GTC TCC ATT GAG GAC CCC TTC 
ala asp gin tyr asn glu leu ala ala lys tyr pro ile val ser ile glu asp pro phe 
901 / 301 931 / 311 

GCT GAG GAT GAC TGG GAG GCC TGG AGC TAC TTC TAC AAG ACC TCT GGC TCT GAC TTC CAG 

30 ala glu asp asp trp glu ala trD fler tvr P he tvJr ly» thr « er ffly *** a»P P»* ffln 
961 / 321 991 / 33i 

ATC GTCGGGT GAT GAC CTT ACC GTC ACC AAC CCC GAG TTC ATC AAG AAG GCC ATC GAG ACC 
ile val gly asp asp leu thr val thr asn pro glu phe ile lys lys ala ile glu thr 
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1021 / 341 1051 / 351 

AAG CCC TGC AAC GCC CTC CTC CTC AAG GTC AAC CAO ATC GOT ACC ATC ACC GAG GCC ATC 

7£Z, a / a asn Ala leU leU leu lys val asn * ln ffly thr lie thr glu ala lie 

1081 / 361 / 371 

AAC GCC GCC AAG GAC TCC TTC GCC GCT GGC TGG GOT GTC ATG GTC TCt caC CGT TCC GOT 
asn ala ala lys asp ser phe ala ala gly trp gly val met val ser his arg ser gly 
1141 / 381 1171 / 391 

GAG ACC GAG GAC GTC ACC ate gCC gac ATC GTT GTC GGT CTC CGT GCC GGC CAO ATC AAG 
th * 9l« asp val thr lie ala asp lie val val gly leu arg ala gly gin lie lys 
1201 / 401 1231 / 411 

5 ACC GCC CCT GCC CGT TCC GAG CGT CTC GCC AAG CTC AAC GAG ATC CTC CGT ATC GAG 

thr gly ala pro ala arg ser glu arg leu ala lys leu asn gin lie leu arg lie glu 
1261 / 421 1291 / 431 

GAG GAG CTC GGT GAC AAG AGO CTC TAG GCC GGT GAC AAC TTC cgC ACT GCC ATC AAC TTG 
?£, g / U gly iSp lyS arg leU tyr gly as P asn P he ar * thr il« »n leu 

/ 441 

TAA 
OGH 



Nachfolgende Sequenzvergleiche (Seq.6) der Aminosauresequenz mit der 
10 SWISSPROT Proteinbank ergaben, daB Clah47 signifikante Homologie zu Enolasen 
zeigt. Im nachfolgenden "multiple sequence alignment" sieht man die hohen 
Homologien und Identitaten zwischen Clah47 und den ubrigen Enolasen (Mensch, 
Ratte, Maus, Drosophila, Hefe). 

Sequenz 6: 

1 50 
. SXqKIWARE Z1DSRSHPTV EVDLyTaKGX* FRAAVPSGAS TGIyEALEXR 
. SlqKIWARE I1DSRGNPTV EVDLhTaKGL FRAAVPSGAS TGIyEALELR 
. SleKIWARE I1DSRGNPTV BVDLyTaKGL FRAAVPSGAS TGIyEALELR 
MtZXalkARq IYDSRGNPTV EVDLTTE1 GI» FRAAVPSGAS TGVBEAX£LR 
.aVSKVYARs VYDSRGNPTV EVE LTTEKGv FRslVPSGAS TGVHEAUEMR 
. aVSKVYARs VYDSRGNPTV EVELTTEKGv FRslVPSGAS TGVBEAXAMR 
MpISKIhsRy VYDSRGNPTV EVDivTEtGI* hRAlVPSvAS TGsBEAcELR 
* R- — DSRGNPTV EV — -T— G- -R — VPS -AS TG--EA-E-R 



plleup . ms £ { enog_human > 
plleup .nsf{ enog_rat ) 
plleup . ms£ { enog__tnouse } 
plleup . msf { eno_drome ) 
plleup . ms£ { enol__yeas t } 
plleup . nsf i eno2_yeast > 
plleup . ms£ (Eno__clado> 
Consensus 



51 

OH pileu P • »sf ( enog_human } DGDKqrYLGX GVLKAVDHIM stXAFAX.1 ss 

Pile«P ^msf { enog_rat } DGDKqrYLGK GVLKAVDHIM stIAPALIss 

plleup. msf{enog_mouse) DGDKqrYLGX GVUCAVDHIM srXAPALIss 

plleup . msf { eno^droae ) DnDXanYhGX sVLKAVgHVM dtlgPeLIXa 

plleup. ms£<enol_yeast> DGDKskWMGK GVLhAVknVM ©VIAPAFVKa 

plleup .mart eno2_yeas t> DeDKsXWMGK GVMnAVnnVN nvZAaAFVKa 

plleup. ms£{Eno_clado> DGDKskWaGK GVtKAVanVM eilAPALIXe 

Consensus D-DK GK -V--AV N 



gLsWEQEJcl 
gLsWEQEkl 
glsWEQEXl 
NLDWDQasX 
MiDVkDQkaV 
KLDVXDQkaV 
MUDVkDQaaV 
V — Q 



100 

DMLMLELDGT 
DMLMLEXDGT 
DNLMLEXDGT 
DMFMlklDGT 
DdFLlsUDGT 
DdFXXsLDGT 
DaFLnltLDGT 
D LDGT 



101 

plleup. ms£<enog_human) EMKSKFGAKA ILGVSIAVcK 

plleup. as£{enog_rat> EMKSKFGAKA ILGVSLAVcK 

plleup. msf{enog_mouse) EMKSKFGAHA I LGVS LAVcX 

plleup. msf |eno_drome) EMKSKFGAKA XLGVSLAVaK 

plleup. ns£{enol_yeast) aNKSKLGAHA ILGVSLAa sr 

plleup. osf {eno2_yeast> aNKSKLGAHA ILGVSMAaar 

plleup. msf {Eno_clado} tMKtKlGAHA ILGVSMAVaX 

Consensus -NK—K- GAMA 2LGVS-A — - 



AGAAErEIPL 
AGAAEKD1P1* 
AGAAErDIPL 
AGAAMCgVPL 
AaAAEKnVPX* 
AaAAEKn VPL 
AaAAEKrVPlj 
A-AA PI* 



YRBZAqXAGM 
YRBZAqriAGM 
YRHXAijLAGM 
YkHXADXAGM 
YkHlADLsks 
YqHlADI*sks 
YaHXsDX»sGt 

y-H 



150 

. .SDLII.PVP 

• • SDXjIXjPVP 
. .SDLILPVP 

• . kElILFVP 
KTSpYVLPVP 
KTSpTVLPVP 
K.kpFVX*PVP 
— I*PVP 



151 

plleup. ms£<enog_huioan} AFMVXMGGSB 

plleup. msf <enog_rat> AFMVXMGGSH 

Pil*up . tasf { enog_nouse > AFMVXMGGSH 

30 plleup. ms£{eno__drome) AFMVXMGGSH 

plleup. msftenol^ east) fXMVlMGGSH 

plleup. msf <eno2_yeast> £LMV1MGGSH 

plleup . ms£ { Eno_cl ado > £MMWMGGSH 



AGMKLAMQEF 
AGKKLAMQEF 
AGMKLAMQEF 
AGMKLAMQEF 
AGgaXALQEF 
AGgaXALQEF 
AGgrXAFQEF 



MXXJVGAESF 
MILPVGAESF 
MXXjPvGAESF 
MILPtGAtSF 
MXaPtGAJctF 
MlaPtGAktF 
MIvPsGApSF 



RDAMRXtGAEV 
RDAKRLGAEV 
RDAMRXtGAEV 
tEAMkMGsEV 
aEALRlGsEV 
aEAMRlGsEV 
tEAMRqGAEV 



200 

YHTLXgVIKd 
YHTLKgVXKd 
YHTLKgVXKd 
YHhLXnVXKa 
YHnLKsltKJc 
YBnLKsltXk 
YqkXJKs 1 tKk. 
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Consensus 



-NV-NGGSH AG — LA-QEF HI-P-GA — F — A G-EV Y — LX X- 



plleup . ms£ < enog_hunan > 
pi leup . ms £ { enog^r a t ) 
pileup .msf < enog_mou se ) 
pileup . msf" { encTdrone ) 
pi 1 eup . tost { enol_ye as t ) 
~ pileup. msf <eno2_y east) 
3 pileup. msf<Eno_cl ado) 
Consensus 



pileup . msf ( enog_human} 
pi leup . msf { enogr_r at ) 
pileup . ds f { cnogjnou se } 
pi leup . ms f { eno_drome ) 
pileup . msf { enol_yeas t ) 
pileup . tost { eno2 jyeas t ) 
pileup . mat { Eno__clado ) 
Consensus 



10 



pileup .msf < enog_human ) 
pileup . msf < enog rat) 
pileup . msf < enogjoou se ) 
pileup . msf ( enoj drome ) 
pileup . mat < enol^ yeas t ) 
pileup . mat < eno2_yeast) 
pi leup . mat { Eno_cl ado ) 
Consensus 



201 

KxGXDATNVG 
KYGKDATNVG 
KYGKDATNVG 
KFG1 DATaVG 
rYGasAgNVG 
rYGasAgNVG 
rYGqsAgNVG 
— G — A — VG 

251 

SEFYrDG. .K 
SEFYrOG. .K 
SEFYrDG. .K 
SEFYKDG. .q 
SEFFKDG . .K 
SEFFKDG. .K 
SEFYXadekK 
SEF 

301 

FDQDDWaAWS 
FDQDDWaAWS 
FDQDDWaAWS 
FDQDhWEAWS 
FaeDDWEAWS 
FaeDDWEAWS 
FaeDDWEAWS 
F — D-W-AWS 



DEGGFAPNI1 
DEGGFAPNI1 
DEGCFAPNI1 
DEGGFAFHI Q 
DEGGvAPH I Q 
DEGGvAFNIQ 
DEGGvAPdIQ 
DEGG-AP-I- 



eNs EALELVX 
eNs EALELVX 
eNs EALELVX 
sNkEALnLIs 
taeEALDLIV 
taeEALDLIv 
taeEALDLIt 
EAL-L-- 



EAZDKAGYTe 
EAXDKAGYTe 
EAIDKAGYTe 
DAXaXAGYTG 
DAIXaAGhdG 
DAIkaAGhdG 
DAZEeAGYTG 



250 

XmvIGMDVAA 
XmvT GKDVAA 
KmvIGMDVAA 
Kiel GKDVAA 
XVXIGLDcAs 
KVXIGLDcAs 
qlklaKDVAs 
1 — D-A- 



YDLDFXs . Pt 
YDLDFKs . Pa 
YDlDFKs.Pa 
YDLDFKNeJcS 
YDLDFXNPnS 
YDLDFKNPeS 
YDLDFKNPdS 
YDLDFX 



DpSrYITGDQ 
DpSrCITGDQ 
DpSrYITGDQ 
DKSoWlpaDk 
DKSkWlTGpQ 
DKSXWITGve 
DKSXWITyEQ 
D-S 



LgaLYQDFVr 
LgaLYQDFVr 
LgaLYQDFVr 
LAnLYkEFIk 
LAdLYhsLmk 
LAdMYhsLmk 
LAdcjYnELaa 
L Y- 



300 

dYPWSIEDP 
nYPWSIEDP 
nYPWSZEDP 
dFPXVSIEDP 
rYPIVSIEDP 
rYPIVSIEDP 
kYFIVSIEDP 
— P-VSIEDP 



KF. . TAnVGI 
KF. .T AnVGI 
KF. . TAnVGI 
nL. .Tgetdl 
hFFKTAg. .1 
hFFKTAg. .1 
yFYKTsgsdf 



351 

ID pileup. msf (enog_human) VNQIGsVTEA IQAcKLAqeH 

pileup. msf {enog_r at) VNQIGsVTEA IQAcKLAqeN 

pileup .msf{cnog__mouse > VNQIGsVTEA IQAcKLAqeN 

pileup. msf {enojdroxne} VNQI GTVTEs laAhlLAXkN 

pileup. msf (enol_yeast) VNQIGTlsEs IXAaqdsfaa 

plleup.msf <eno2__yeast) VNQIGTlsEs IXAaqdsfaa 

plleup.msf {Eno_cl ado) VNQI GT1TEA InAaKdsfaa 

Consensus VNQIG E- I -A — 

401 

pileup. msf <enog_human) XTGAPCRSER LAKYNQLKRI 

Pileup. msf (enog_rat) KTGAPCRSER LAKYNQLMRI 

20 P lle UP.aaf ienog^mouse) KTGAPCRSER LAKYNQLKRI 

pileup. msf {enoTdroxne) KTGAPCRSER LAXYNQ1LRI 

pileup. msf <enol_yeast) KTGAPaRSER LAK1NQLLRI 

pileup. msf <eno2_yeast) KTGAPaRSER LAK1NQLXRI 

pileup. msf <EnO M Cl ado) KTGAPaRSER 1AK1NQ1LRI 

Consensus KTGAP-RSER LAX-NQ — RI 



QIVGDDLTVT 
QIVGDDLTVT 
QIVGDDLTVT 
QIVGDDLTVT 
Q I VaDDLTVT 
Q I VaDDLTVT 
QIVGDDLTVT 
QIV-DDLTVT 



GWGVMVSHRS 
GWGVMVSHRS 
GWGVMVSHRS 
GWGtMVSBRS 
GWGVMVSHRS 
nWGVMVSHRS 
GWGVMVSHRS 
-WG-MVSHRS 



NPKRI er AVE 
N PKR I e r AVE 
NPKRI erAVE 
NPKRI a tAVE 
NPKRIatAIE 
NPaRIatAIE 
NPeflXkAlE 
MP — I — A-E 



GETEDTFIAD 
GETEDTFIAD 
GETEDTFIAD 
GETEDsFIgD 
GETEDTFIAD 
GETEDTFIAD 
GETEDVtlAD 
GETED — I-D 



350 

eKACNCLLLK 
_eKACHCLLLK 
eKACNCLLLK 
kKACNCLLLK 
kKAadaLLLK 
kXAadaXXLK 
tKACNaLLLK 
—KA I.I.T.K 

400 

LWGLcTGQ I 
LWGLcTGQI 
LWGLcTGQ I 
LWGLsTGQI 
LWGLrTGQI 
LWGLrTGQI 
lWGLraGQI 
-W6L — GQI 



EEELGDEARF 
EEELGEEARF 
EEELGDEARF 
EEElGagvXF 
EEELGDnAvF 
EEELGDkAvY 
EEELGDJtrlY 
EEE-G 



442 

AGhNFRNPSV L. 
AGhNFRNPSV L. 
AGhNFRNPSV L. 
AGksFgkPq. . . 
AGeNFhhgdk L. 
AGeNFhhgdk L. 
AGdNFRtaln Lz 
AG — F — — 



Wie schon bei Clah53 envahnt, kann auch in diesem Fall die Verbindung 
zwischen Proteinfunktion und Allergenitat nicht hergestellt werden. Enolasen sind 
25 aber aus einem anderen Punkt heraus interessant. Bei Saccharomyces cerevisiae 
konnte die Enolase (ENOl) als "heat-shock-Protein" nachgewiesen werden. Die 
Expression von ENOl wird hier als Mehrgebrauch von Energie in dieser schwierigen 
Stressbedingung gedeutet (lid* und Yahara 1985). In Hefe wird Enolase auch in der 
stationaren Phase sowie unter Schwefelhunger vermehrt exprimiert (Cohen 1987). 



WO 95/06121 PCT/ATO4/00120 

18 

Die nachfolgende Sequenz 7 zeigt mit Computerunterstutzung gefundene 
B-Zellepitope. Hoher Antigenindex, unter Berucksichtigung von Sekundarstruktur, 
Oberflachenlage, Hydrophilitat, Flexibility etc. 



5 Sequenz 7: CIah47=Enolase_cIado: B-Zellepitope 
(1) ANGABEN ZU SEQ ID NO:7 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 
10 (iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

15 Tyr Val Tyr Asp Ser Leu Gly Asn Pro Thr Val Glu Val (10-22) 

Pro Ser Val Ala Sex Thr Gly Ser Bis Glu Ala Cys Glu Leu Arg Asp Gly Asp Vya Scr Lys Trp 
Ala Gly Lys Gly Val Thr I*ys (36-64) 

Asn 1-ys Leu Asp Gly Thr Thr Asn tys Thr tys lie GXy Ala (95-108) 
Ala Bis lie ser Asp Leu Ser Gly Thr I*ys Lys Pro Phe Val (132-145) 

Tyr Gin Lys Leu Lys Ser Leu Thr Lys Lys Arg Tyr Gly Gin Ser Ala Gly Asn Val Gly Asp Glu 
20 (190-211) 

Phe Lys Asn Pro Asp Ser Asp Lys Ser Lys Trp He Thr Tyr Glu (264-278) 
Ser Tyr Phe Tyr Lys Thr Ser Gly Ser Asp Phe (309-319) 
Ala lie Asn Ala Ala Lys Asp Ser Phe Ser Ala Gly Trp Gly (359-372) 
Met Val Ser His Arg Ser Gly Glu Thr Glu Asp Val Thr Ket (374-387) 
His He Val Arg Arg Ser Arg Ala Gly Gin He Lys Thr Gly (388-401) 
25 Ala Pro Ala Arg Ser Asp Gly Leu Ala Lys Leu Asn (402-413) 

lie Leu Arg He Glu Glu Glu Leu Gly Asp Lys Arg Leu Tyr Ala Gly Asp Asn Phe Arg Thr Ala 
(415-436) 



Die nachfolgende Sequenz 8 zeigt die berechneten T-Zellepitope im 
30 1-Lettercode. Amphipathische Bereiche mit einem Score geringer als 10 wurden fur 
nicht relevant angenommen. 



DOCIO: <WO 9506121A2 I > 
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5 Sequenz 8: Vorausgesagte amphipathatische Segment 

T-Zellepitope 

IHSRYVYDSLGN 
KGVTKAVANVNEIIAP 
DAFLNKLDGT 
1Q AHISDLSG 

PSFTEAMRQGAEVYQKLKSLTK 

GQSAGNV 

EALDLITDAIEE 

LADQYNEL 

EAWSYFY 

VNQIGTITEAINAAK 

DGLAKLNQILRIEE 

15 

(1) ANGABEN ZU SEQ ID NO:8 

(i) SEQUENZKENNZEICHEN: 
(A) LANGE: einzeln angefuhrt 

20 (B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbamm 
25 (C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

lie Bla Ser Arg Tyr Val Tyr Asp ser Leu Gly Asn (6-17) 

Lys Gly Val Thr Lys Ala Val Ala Asn Val Asn Glu Zle Zle Ala Pro (60-7S) 
Asp Ala Phe Leu Asn Lys Leu Asp Gly Thr (91-100) 
Ala Bis Zle Ser Asp Leu Ser Gly (132-139) 
2Q Pro Ser Phe Thr Glu Ala Met Arg Gin Gly Ala Gin Val Tyr Gin Lys Leu Lys Ser Leu Thr Lys 
(177-198) 



'-OOCIO: <WO_9S06121A2_I_> 
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Gly Gin Ser Ala Oly Asn Val (202-208) 

Olu Ala Leu Asp Leu lie Thr Asp Ala He Olu Olu (223-234) 
Leu Ala Asp Oln Tyr Asn Clu leu (280-287) 
Glu Ala Trp ser Tyr Phe Tyr (306-312) 

Val Asn Oln lie Gly Thr lie Thr Glu Ala lie Asn Ala Ala Lys (350-364) 
5 Asp Gly teu Ala Lys Leu Asn Gin He Leu Arg He Glu Glu (407-420) 

Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
Midpoints, die N-terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flankiert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" grofler als 10 ist. 

10 

C. Clah22 

Die nachfolgende Sequenz 9 zeigt die vollstandige cDNA Sequenz von 
Clah22. Die daraus abgeleitete Aminosauresequenz ist ebenfalls ersichtlich. Der 
offene Leserahmen von Clah22 betragt 615bp, was einer Aminosaurelange von 205 
15 Aminosauren entspricht. Das berechnete Molekulargewicht des rekombinanten 
Proteins betragt 22341 Dalton. 

Sequenz 9: YCP4_clado -> 1-phasen Translation 22341 Dalton 
(1) ANGABEN ZU SEQ ID NO'9 

20 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 615 Basenpaare / 205 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 

(C) STRANGFORM: ds 

(D) TOPOLOGIE: linear 

25 (ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 

(iii) HYPOTHETISCH: nein 

(iv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 

(vi) URSPRUNGLICHE HERKUNFT: 

(A) QRGANISMUS: Cladosporium herbarum 
30 (C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 



WO 95/06121 PCT/AT94/00120 
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DNA sequence 615 b.p. ATGGCTCCCAAG ... AACTTCCAGTGA linear 

1/1 31/11 

ATO GCT CCC AAG ATC CCC ATC ATC TTC TAC TCC ACC TGG GGA CAC GTC CAO ACC CTC CCC 
met ala pro lya lie ala lie lie phe tyr aer thr trp gly his val gin thr leu ala 
61 f 22 91 / 31 

^ <3AO GCC GAG GCc AAG GOc ATC CGC GAG GOC GGC GGT TCC GTC GAC CTC TAC CGC GTC CCc 
glu ala glu ala lys gly lie arg glu ala gly gly ser val asp leu tyr arg val pro 
122 / 41 151 / 51 

GAG ACC CTC ACC cAG GAG GTT CTG ACC AAG ATG CAC GCT CCT CCT AAG GAC GAC TCC ATC 
glu thr leu thr gin glu val leu thr lys. met his ala pro pro lys asp asp ser lie 
181 / 61 221 / 71 

CCT GAG ATC ACC GAC CCT TTC ATT CTC GAG CAG TAC GAT CGC TTT CCT CAT GGO CAT CCC 
pro glu ile thr asp pro phe lie leu glu gin tyr asp arg phe pro his gly his pro 
241 / 81 271 / 91 

ACC CGC TAC GGC AAC TTC CCC GCG CAG TGG AGG ACC TTC TGG GAC CGC ACC GGC GGC CAA 
thr arg tyr gly asn phe pro ala gin trp arg thr phe trp asp arg thr gly gly gin 
301 / 101 331 / in 

1Q TGO CAG ACC GGT GCC TTC TGG GGC AAG TAC GCC GGC CTG TTC ATC ACT ACT GGT ACC CAG 
u trp gin thr gly ala phe trp gly lys tyr ala gly leu phe ile ser thr gly thr gin 

361 / 122 391 / 131 

GGT GGT_GGA CAG GAG- AGC ACT GCT CTC GCT GCC ATG AGC ACT CTC TCC CAC CAC GGC ATT 
gly gly gly gin glu ser thr ala leu ala ala net ser thr leu ser his his oly ile 
422 / 141 451 / 151 

ATC TAC GTT CCT CTT GGC TAC AAG ACC ACA TTC CAC CTC CTC GGC GAC AAC AGC GAG GTC 
lie tyr val pro leu gly tyr lys thr thr phe his leu leu gly asp asn ser glu val 
481 / 161 511 / i71 

CGC GGT GCC GCA OTG TGG GGC GCT GGT ACC TTC TCC GGT GGT GAC GGT TCC CGC CAO CCC 
arg gly ala ala val trp gly ala gly thr phe ser gly gly asp gly ser arg gin pro 
541 / 181 571 / i9i 

1J TCC CAG AAG GAA TTG GAG CTC ACC GCC CAG GGT AAG GCC TTC TAT GAG GCT GTC GCC AAG 
ser gin lys glu leu glu leu thr ala gin gly lys ala phe tyr glu ala val ala lys 
601 / 201 
GTC AAC TTC CAG TGA 
val asn phe gin OPA 

Homologiesuchen mit dem sequenzierten Protein in der 
SWISSPROT-Proteindatenbank zeigten, dafi das Allergen Clah22 signifikante 
20 Homologie zu dem Hefeprotein YCP4 aufweist. Die Identitat der beiden Proteine 
betragt 56%, die Homologie sogar 70%. Eine so hohe Ahnlichkeit laBt wohl eine 
gemeinsame Funktion dieser beiden Proteine vermuten. Die nachfolgende Sequenz 
10 spiegelt die hohe Homologie von Clah22 und YCP4 wieder. 



25 



Sequenz 10: 
ycp4_yeast x ycp4_clado 



1 MV . KIAlITYSTYGHIDVIAQAVKKGVEAAGGKADiyKVEETLPDEVLTK 49 

I - I 1 1 1 I N I : I | : : . H : | I I : . 1 1 I . . I : I 1 1 . I 1 1 • : I t I I I 
1 MAPKIAI I FYSTWGHVQTIJ^EAZAKGIREAGGSVDLyRVPETLTQEVLTK 50 
• • • . . . . 

50 MHAPQKFEDX FVATEKTLLE . YDAFLFGVPTRFGNLPAQWSAFWDKTGGL 98 
I : II . I . : . I I I : . : | | || | | 1 1 1 : 1 1 : 1 1 1 1 .. I I I : I I I 

51 KHAPPKDDS I PE I TDPFI LEQYDRrPHGRPTRyGKFPAQWRTFVDRTGGQ 100 

• 

99 WAXGSLKGKAAGZFVSTSSYGGGQESTVKACLSYIABBGI IFLPLGYJQJS 146 



SOOCiD: <WO_9506121A2J_> 
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J/* 1 * 8 11 I I I I I I I . |.:| I . I I I I I : : I I I || . . 

101 WQTGAFWGKYAGXFX STGTQGGGQESTAIAAMSTI#SHHGX 1 WPW5YKTT 150 

149 FAEX*A£XEEVHGGSPWGAGTIdAGPDGSXCTASFLEXJUAEXQGKTFYETAK 198 

mas ' |: - * I - — I I I 1 1 : - I - 1 I I I :|. || :.. |||.|||.. 

151 FHIXGDNSEVRGAAVWGAGTFSGGDGSRQPSQKELELTA. QGKAFYEAVA 199 

199 KL.FPA 203 
I: I.. 

200 KVHFQZ 205 



Die Sequenz, bzw. der offene Leserahmen von YCP4, wurde im Rahmen des 
Hefegenomprojektes am Chromosom 3 von Saccharomyces cerevisiae lokalisiert und 
publiziert (Biteau et al. 1992). Eine durchgefuhrte Disruption von YCP4 zeigte nach 
(Biteau et al. 1992) keinen Phanotyp. 

Es hat sich auch gezeigt, daB auch Clah22 einen homologen Partner in 
lOAltemaria alternata besitzt. Die folgende Sequenz 11 zeigt ein "sequence 
alignment" zwischen den Allergenen Alta22 und Clah22. 



Sequenz 11: 
15 y c P4_a!t x ycp4_clado 

1 MAPKIA1VYYSMYGHIKKMADAELKGIQEAGGDAKLFQVAETL.PQEVLDK 50 

- iiIi M|::M sN:--:|:|| 1 1 1 . 1 1 1 1 . . . I : . 1 : 1 1 | . 1 1 1 1 . | 

1 MAPKI AI I FY S TWGHVQTIAEAEAKG I REAGG SVD L YKVP ETLTQEVX.TK 50 

51 WMPOTSSVPVIXDPAVI^FDGIIJ^ 1 00 

I • I 1 1 1 1 . 1 : 1 : . I I : I | : : | : | 1 1 1 1 1 1 1| II : : 1 1 II : 1 1 i 
51 MHAP PKDD S 1 PE I TD PF 1 1»EQ YDRFPHGHPTRYGNFPAQWRTFWDRTGGQ lOO 
• . . 

101 WQQGAFWGKYAGVFVSTCTIX^^ETTAITSMSTLVDHGFir^LOYKTA 150 

on 1 ' illtll!|f:|:|||| 1 1 1 1 1 * 1 1 : . . 1 1| | .11:11 II Mil I 

20 101 WQTGAFWGKlf AGUI STGTQGGGQE5TAIAAUSTLSRBGZ I yVpicYlCTT 150 

151 FSMLANU5EVHGGSPWGAGTFSAGDGSRQPS. . ELELNIAQAQGKAFYEA 198 

UilL^Ul 1 '"' 1 111 ■■■•■■Ml llll Illl. 1 1 1 1 1 1 1 1 1 
151 FHIXGDNSEVRGAAVWGAGTFSGGDGSRQPSQKELELT. . .AQGXAFYEA 197 

199 VAXAH.QZ 205 

IN.: II 
198 VAKVNFQZ 205 

25 Die mit Computerunterstutzung gefundenen B-Zellepitope sind in der 

nachsten Sequenz 12 zu sehen. 

Sequenz 12: CIah22=YCP4_cIado: B-Zellepitope 
(1) ANGABEN ZU SEQ ID NO: 12 

30 

(i) SEQUENZKENNZEICHEN: 



OOCIO: <WO 95061 21 A2_l_> 
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(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 
5 (vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Tyr ser Thr Trp Oly Bis Val Gin (10-17) 

Olu Ala Glu Ala Lys Gly Zle Arg Olu Ala Gly Gly Ser (21-33) 
10 Z.ys Met Bis Ala Pro Fro Lys Asp Asp Ser Zle Pro Glu Zle Thr Asp Pro (50-66) 

Leu Glu Gin Tyr Asp Are Phe Pro Bis Gly Bis Pro Thr Arg Tyr Gly Asn Phe (69-86) 

Pro Ala Gin Trp Arg Thr Phe Trp Asp Arg Thr Gly Gly Gin Trp Gin Thr Gly (87-104) 

Zle Ser Thr Gly Thr Gin Gly Gly Gly Gin Glu Ser Thr Ala Leu Ala (115-130) 

Zle Tyr Val Pro Leu Gly Tyr Lys Thr Thr Phe (141-151) 

Leu Leu Gly Asp Asn Ser Glu Val Arg Gly Ala (153-163) 
15 Gly Ala Gly Thr Phe Ser Gly Gly Asp Gly Ser Arg Gin Pro Ser Gin Lys Glu Leu Glu Leu Thr 

"(167-188) 

Die folgende Sequenz 13 zeigt die berechneten T-Zellepitope. 
Amphipathische Helices, flankiert von hydrophilen Bereichen stellen das 
Grundmuster der Berechnung fur MHC II assoziierte Peptide dar. 

20 

Sequenz 13:Vorausgesagte amphipathatische Segmente 

T-Zellepitope 

YSTWGHVQTLAEA 
IREA 

25 GSVDLYRVPETLTQEVLTKMH 
DSIPEITD 

YDRFPHGHPTRYGNFPAQWRTFWDRTGGQ 

AAMSTLS 

AFYEA 

(1) ANGABEN ZU SEQ ID NO: 13 

30 

(i) SEQUENZKENNZEICHEN: 



-OCtD: <WO 95061 21 A2_l_> 
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(A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 
5 (vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Tyr Ser Thr Trp Gly Bis Val Gin Thr Leu Ala Glu Ala (10-22) 
He Arg Glu Ala (27-30) 

10 01 V Se * Val Asp Leu Tyr Arg Val Pro Glu Thr Leu Thr Gin Glu Val Leu Thr Lys Met HI a 
(32-52) 

Asp Ser lie Pro Glu lie Thr Asp (58-65) 

Tyr Asp Arg Phe Pro His Gly Bis Pro Thr Arg Tyr Gly Asn Phe Pro Ala Gin Trp Arg Thr Phe 
Trp Asp Arg Thr Gly Gly Gin (72-100) 
Ala Ala Met Ser Thr Leu Ser (130-136) 
15 Ala Phe Tyr Glu Ala (193-197) 

Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
Midpoints, die N-terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flankiert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" groBer als 10 ist. 

20 

D. Clahll 

Die folgende Sequenz 14 zeigt die vollstandige cDNA-Sequenz von Clahll 
und die von ihr abgeleiteten Aminosauresequenz. Der offene Leserahmen umfaBt 
336bp bzw. 112 Aminosauren. Das berechnete Molekulargewicht bertagt 11078 
25 Dalton und entspricht somit dem 1 lkD groflen antigenen Protein, das im Westernblot 
von 4% der Patienten erkannt wird. 

Sequenz 14: Clahll =rla2_clado - > 1-phasen Translation 11078 Dalton . 

30 

(1) ANGABEN ZU SEQ ID NO: 14 



WO 95/06121 



PCT/AT94/00120 



25 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 336 Basenpaare / 112 Aminosaurereste 

(B) ART: Nukleinsaure / Protein 

(C) STRANGFORM: ds 
5 (D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNA zu mRNA / Protein 

(iii) HYPOTHETISCH: nein 

(iv) ANTISENSE: nein 

(v) ART DES FRAGMENTS: Gesamtsequenz 

(vi) URSPRtJNGLICHE HERKUNFT: 

10 (A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 



DNA Sequenz 336 b.p. ATGAAGTACCTC ... CTCTTCGACTAA linear 



1 


/ 


1 
















31 


/ 


11 
















ATG 


AAG 


TAC 


CTC 


GCA 


GCT 


TTC 


CTC 


CTC 


CTC 


GGC 


TTG 


CCG 


GGC 


AAC 


TCC 


TCC 


CCC 


TCT 


GCT 


15 


lys 


tyr 


leu 


ala 


ala 


phe 


leu 


leu 


leu 


gly 


leu 


pro 


gly 


asn 


ser 


ser 


pro 


ser 


ala 


61 


/ 


22 
















91 


/ 


31 














GAG 


GAC 


Arc 


AAG 


ACC 


GTC 


CTC 


AGC 


TCC 


GTT 


GGC 


ATC 


GAC 


GCC 


GAC 


GAG 


GAG 


CCG 


TCT 


GAG 


glu 


asp 


lie 


lys 


thr 


val 


leu 


ser 


ser 


val 


gly 


lie 


asp 


ala 


asp 


glu 


glu 


pro 


ser 


gin 


122 


/ 


41 
















151 


/ 


51 
















CTC 


CTC 


CTT 


AAG 


GAG 


CTC 


GAG 


GGC 


AAG 


GAC 


ATC 


AAC 


GAG 


CTG 


ATC 


TCT 


TCC 


GGC 


TCT 


GAG 


leu 


leu 


leu 


lys 


glu 


leu 


glu 


gly 


iy» 


asp 


lie 


asn 


glu 


leu 


lie 


ser 


ser 


gly 


ser 


glu 


181 


/ 


61 
















221 


/ 


71 














AAG 


CTC 


GCC 


TCCGGTT 


CCC 


TCT 


GGT 


GGT 


GCT 


GGT 


GCC 


GCC 


TCT 


GCC 


GGT 


GGT 


GCT 


GCC 


GCC 


lys 


leu 


ala 


ser 


val 


pro 


ser 


gly 


gly 


ala 


gly 


ala 


ala 


ser ala gly 


gly ala 


ala 


ala 


241 


/ 


61 
















271 


/ 


91 
















OCT 


GGT 


GOT 


GCC 


GCT 


GAG 


GCC 


GCC 


CCC 


GAG 


GCC 


GAG 


AAG 


GCT 


GAG 


GAG 


GAG 


AAO 


GAG 


GAG 


20 


gly 


gly 


ala 


ala 


glu 


ala 


ala 


pro 


glu 


ala 


glu 


iy» 


ala 


glu 


glu 


glu 


lys glu glu 


301 


/ 


101 
















331 


/ 


in 
















TCT 


GAC 


GAC 


GAC 


ATG 


GGC 


TTC 


GGT 


CTC 


TTC 


GAC 


TAA 


















ser 


asp 


asp 


asp 


met 


giy 


phe 


gly 


leu 


phe 


asp 


OCH 



















Sequenzvergleiche mittels FASTA in der SWISSPROT-Proteindatenbank 
ergaben, dafl das vorliegende llkD grofie allergen wirkende Protein signifikante 
Homologien bzw. Identitaten zu RLA2, einem hoch konservierten ribosomalen 
25 Protein, besitzt. Die nachfolgende Sequenz 15 spiegelt die hohe Homologie wieder. 
Gezeigt sind "multiple alignments" von Mensch, Ratte, Drosophila, 
Schizosaccharomyces pombe, Saccharomyces cerevisiae, Dictyostelium, 
Trypanosoma und den beiden Pilzen Cladosporium herbarum und Alternaria 
alternans. 
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Sequenz 15: 



1 50 
plleup.insf {rla2_human) MrYvAsYXXa aJJGGHsSPSA fcDIKKILDSV GZEADDDRln KVISEXAGKn 
plleup.ms£<rla2 rat) MrYvAsYIXa aLGGNsnFSA XDIKKILDSV GIEADDERln KVXSELnGKn 



*»OOCK>: <WO 96061 21 A2_l_> 
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pilcup.maf <rla2_<lrome) MrYvAAYLLa vLGGkdSPan 

pi 1 eup . ms f { r 1 a2_al t > MKhLAAYLLl GLGGNtspsA 

P±leup.ms£(rla2_clado) MKYLAAFLL1 GL.GHsSPSA 

pileup. tasf <rla2_schpo) MKYLAAYLL1 tvGGkdSPSA 

pileup. msf{rla2_yeast} KKYLAAYLL1 naaGNt.PdA 

pileup . msf { rla2_dicdi ) .XYLAAYLLa sLsGH. .anA 

pileup. ms£(rla2__trycr) MKYLAAYaLv GLsGgt.FSk 

Consensus A L- g— — 



SD1 eXIXtS SV 
ADVKaVLESV 
eDIKtVLsSV 
SDXesVLstV 
tklKalLESV 
asVtKILqSV 
SaVeaVLkaa 



GVEvDaERlt 
GIEADsDRlD 
GXDADSEpsq 
GIEAEsERiE 
GIEiEDEkva 
GVEvDaaRvE 
GVpvppsRvD 



KVXkELaGXa 
K1ISELEGKD 
lllJcELEGKD 
tllnELnGXD 
sVlSaLEGKs 
sVckEIDGKD 
alf aEFaGKD 
CK- 



51 

t pileup. ms£{rla2_human) lEDvXAqGig KL.ASVPAGG 

pileup. ms£{rla2_rat) XEDvIAqGvg KL.ASVPAGG 

pileup. ms£{rla2_drome> XDDLXkEGrE KL.sSnFvGG 

pileup. ms£{rla2_alt) XnELXAsGsE XL.ASVFsGG 

pileup. ms£{rla2_clado> XnELXssGsE KL. ASVPsGG 

pileup. ms£<rla2_schpo) XDELXAaGnE KL.AtVPtGG 

pileup. msf<rla2_yeast> VDELItEGnE KL.AaVFAaG 

pileup . ms£< rla2_dicdi ) VqaLIAaGks Kv. gSVaAaa 

pileup m maf{ rla2_trycr > £DtvctEGks KLvggVtrpn 

Consensus — — - — g — K — 



AvAvSAApgs 
AvAvSAApgs 
ggAvaAA. .d 
AggAaAsggA 
AgAASAggAA 
AasA.ApAAA 
pasAggAAAA 
ApAAatsAAp 
AatASAptAA 



AApAAGsApa 
AApAAGsApa 
AApAAaAggD 
AAaggsAqaE 

AAgg 

AggAApAAeE 

sgdA 

AAaAAapAkk 
AAassGAAap 



100 

AAEEKKDEKK 
AAEEKKDEKK 
kkEaXKEEXK 
AApEaakE . , 
.AEEXaEE. , 
AAkEeakE. 
AAEEeXEE. , 
WEEKX. . 
AAaae . . . 



101 H7 

in P ileu P*»s£{rla2_human) EESEESDDDM GFGLFD. 

*V pileup. ms£<rla2_rat) EESEESDDDM GFGLFD. 

pileup. ms£<rla2_drome) EESEseDDDM GFaLFE. 

pileup. msf {rla2_alt) EEkEESDEDH GFGLFDZ 

plleup.msf{rla2_clado> EkkEESDDDM GFGLFDZ 

pileup. ms£{rla2_schpo) E. .EESDEDM GFGLFD. 

pileup. ms£{rla2_yeast) EaaEESDDDM GFGLFD. 

pileup. msf{rla2_dicdi> . . . EESDDDM GmGLFD. 

pileup. ms£{rla2_trycr} . . . EEeDDDM GFGLFD. 

Consensus E — D-DM G — LF-- 



15 Das allergene Protein Clahll ist nicht nur wegen seiner Eigenschaft als 

Allergen von Cladosporium herbarum interessant. Ribosomale Proteine, hier im 
speziellen die humanen ribosomalen Proteine PI und P2, sind in der Literatur als 
Autoantigene beschrieben worden (Francoeur et al. 1985, Rich et al. 1987 , Hines et 
el. 1991). 20% der Patienten mit Lupus erythematosus besitzen AutoantikSrper 
(anti-rRNP) gegen Komponenten der Ribosomen, im speziellen Autoantikorper 
20gegen die ribosomalen Proteine P0 (38kD), PI (16kD) und P2 (15kD). Das P2 
Protein entspricht in seiner Homologie dem allergenen Protein Clahll. Die humanen 
Autoantikorper kreuzreagieren mit ahnlichen Proteinen, was heiflt, da8 Epitope 
erkannt werden die in der Evolution stark konserviert wurden. Die Basis der 
immunologischen Kreuzreaktivitat bildet die 17 Aminosaurereste lange 
carboxyterminale Region KEESEESD(D/E)DMGFGLFD. Ob eine in der Kindheit 
25 und Jugend erfolgte Sensibilisierung durch Clahll mit einem im Erwachsenenalter 
auftretenden Autoimmunkrankheit korreliert, bedarf einer genauen Prufung. 
Applikationen von ribosomalen Proteinen konnten allerdings in Mausen keine 
Autoimmunkrankheit erzeugen (Hines et al. 1991). 

Die gezeigten B-Zellepitope in der nachsten Sequenz 16 sind unter 
Berucksichtigung von Sekundarstruktur, Oberflachenlage, Hydrophilitat, Flexibilitat 
30 etc. berechnet worden. 
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Sequenz 16: CIahll=rIa2_cIado: B-Zellepitope 
(1) ANGABEN ZU SEQ ID NO: 16 

(i) SEQUENZKENNZEICHEN: 
5 (A) LANGE: einzeln angefuhrt 

(B) ART: Protein 

(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 

10 (A) ORGANISMUS: Cladosporium herbarum 

(C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Gly Leu Pro Gly Asn Ser Ser Pro ser Ala Glu Asp Zle Lys Thr Val Leu (11-27) 
Oly He Asp Ala Asp Olu Glu Pro Ser Oln Leu Leu Leu (31-43) 
Lys Olu Leu Olu Oly lys Asp He Asn Glu Leu (44-54) 
15 Ser Ser oly ser Glu Lys Leu Ala Ser Val Pro Ser Gly oly Ala Gly (56-71) 

Ala Glu Ala Ala Pro Glu Ala Glu Lys Ala Glu Glu Glu Lys Glu Glu Ser Asp Asp Asp Met Gly 
M»e (85-107) 

Die nachfolgende Sequenz 17 zeigt die berechneten T-Zellepitope. Bereiche 
mit einem Score geringer als 10 werden als nicht relevant angenommen. 

20 

Sequenz 17: Vorausgesagte amphipathatische Segmente 
T-Zellepitope 



EDIKTV 

EGKDINELISSGSEKLASVPSG 
25 ASAGG 



(1) ANGABEN ZU SEQ ID NO: 17 

(i) SEQUENZKENNZEICHEN: 
3q (A) LANGE: einzeln angefuhrt 
(B) ART: Protein 
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(ii) ART DES MOLEKULS: Peptide 

(iii) HYPOTHETISCH: nein 

(v) ART DES FRAGMENTS: N-Terminus bis C-Terminus 

(vi) URSPRUNGLICHE HERKUNFT: 

(A) ORGANISMUS: Cladosporium herbarum , 
5 (C) ENTWICKLUNGSSTADIUM: Sporen und vegetative Hyphen 

Glu Asp lie lys Thr Val (21-26) 

Glia Gly lys Asp He Asn Glu Leu lie Ser Ser Gly Ser olu Lys Leu Ala ser Val Pre Ser Gly 
(47-68) ' 
Ala Ser Ala Gly Gly (82-86) 

10 

Die T-Zellepitope errechnen sich aus den Aminosaurepositionen der 
Midpoints, die N-terminal von einem Lysin (K), C-terminal von einem Prolin (P) 
flanldert werden (=Flags). Es sind nur dann potentielle T-Zellepitope vorhanden, 
wenn der "Score-Index" groBer als 10 ist. 

15 



20 
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Patentanspriiche 

1. Rekombinante DNA Molekule, die fur Polypeptide kodieren, die die 
Antigenitat der Allergene Clah53, Clah47, Clah22 und Clahll besitzen oder fur 
Peptide, die mindestens ein Epitop dieser Allergene aufweisen, dadurch 
gekennzeichnet, daB sie Nukleinsauresequenzen aufweisen, die mit den Sequenzen 
1, 3-5, 7-9, 12-14 sowie 16 und 17, oder mit Teilbereichen dieser Sequenzen in 
homologer Weise ubereinstimmen, bzw. Nucleinsauresequenzen, die mit den 
genannten Nucleinsauresequenzen unter stringenten Bedingungen hybridisieren. 

2. Rekombinante DNA-Molekule nach Anspruch 1, dadurch gekennzeichnet, 
daB sie Nukleinsauresequenzen aufweisen, die durch Degeneration aus den 
dargestellten Sequenzen 1, 3-5, 7-9, 12-14 sowie 16 und 17 ableitbar sind. 

3. Rekombinante DNA Molekule nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, daB sie Nukleinsauresequenzen aufweisen, die fur Polypeptide 

^ kodieren, die als Antigene kreuzreaktiv mit den Allergenen Clah53, Clah47, Clah22 
und Clahll sind und zu diesen eine hohe Homolpgie aufweisen. 

4. Rekombinante DNA-Molekule nach Anspruchen 1 bis 3 dadurch 
gekennzeichnet, daB sie funktionell mit einer Expressionskontrollsequenz zu einem 
Expressionskonstrukt verbunden sind. 

5. Wirtssystem zur Expression von Polypeptiden, dadurch gekennzeichnet, 
daB es mit einem rekombinanten Expressionskonstrukt nach Anspruch 4 transformiert 
ist. 

6. Aus einem DNA-Molekul nach einem der Anspruche 1 bis 3 abgeleitetes 
rekombinantes oder synthetisches Protein Oder Polypeptid, dadurch gekennzeichnet, 
daB es die Antigenitat von Clah53, Clah47, Clah22 oder Clahll, oder zumindest von 
einem Epitop dieser Proteine, aufweist. 

^ 7. Rekombinantes oder synthetisches Protein oder ein Polypeptid nach 

Anspruch 6, dadurch gekennzeichnet, daB es eine Aminosauresequenz aufweist, die 
den gezeigten Sequenzen 1, 3-5, 7-9, 12-14 sowie 16 und 17 zur Ganze oder 
teilweise entspricht. 

8. Rekombinantes oder synthetisches Protein oder Polypeptid nach Anspruch 
6 oder 7, dadurch gekennzeichnet, daB es ein Fusionsprodukt darstellt, das die 
3Q Antigenitat der Allergene Clah53, Clah47, Clah22 oder Clahll, oder zumindest 
eines Epitops davon aufweisen und einen zusatzlichen Polypeptidanteil besitzt, wobei 
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das gesamte Fusionsprodukt von der DNA eines Expressionskonstrukts gemaB 
Anspmch 4 kodiert wird. 

9, Rekombinantes oder synthetisches Protein oder Polypeptid nach Anspruch 
• 8, dadurch gekennzeichnet, daB der besagte zusatzliche Polypeptidanteil 

fl-Galaktosidase oder ein anderes zur Fusion geeignetes Polypeptid ist. 

10, Diagnostisches oder therapeutisches Reagens, dadurch gekennzeichnet, 
daB es ein synthetisches Protein oder Polypeptid gemaB einem der Anspruche 6 bis 9 
enthalt. 

11, Verfahren zum in vitro -Nachweis der Allergie eines Patienten gegen die 
Allergene Clah53, CIah47, CIah22 oder Clahll, dadurch gekennzeichnet, daB die 
Reaktionder IgE Antikorper im Serum des Patienten mit einem rekombinanten oder 
synthetischen Protein oder Polypeptid nach einem der Anpruche 6 bis 9 gemessen 
wird. 

12, Verfahren zum in vitro - Nachweis der zellularen Reaktion auf die 
Allergene Clah53, Clah47, Clah22 oder Clahll, dadurch gekennzeichnet, daB ein 
rekombinantes oder synthetisches Protein oder Polypeptid nach einem der Anspruche 
6 bis 9 zur Stimulierung oder Hemmung der zellularen Reaktion eingesetzt wird. 
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Fig.l: Westernblotting eines 13,5%iges Polyacrylamidgels, nach Auftrennung von 
Cladosporium herbarum Proteinextrakt und Inkubation mit Sera verschiedener Patienten. 




Fig.2: Auftrennung von Cladosporium herbarum Proteinextrakt auf einem 17,5%igen 
Polyacrylamidgel; Inkubation mit Paticntensera; Detektion mit Jod-markiertem anti-human IgE 
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